0VoxCPM2雨落版整合包
本镜像构建和运行所需的基础环境。
3.启动成功后默认操作页面如下(可以看到为非常多的业务场景设置了很贴心的功能):
4. 而且还支持查看内部原理,不管是词表部分,还是长文本切分,亦或是里面的语音降噪,都有展示。当然最重要的或许还是文本规范化,如下展示:
5.而且还贴心的准备了从视频中提取音频的功能,如下:
6.同时还支持查看音频文件的信息,如下:

该镜像支持自动启动,启动日志可以去JupyterLab中的/workspace目录下的log.txt查看,启动成功的日志如下:
如果还是不明白如何操作,详情参考: https://wcnn68ei31q6.feishu.cn/wiki/A1RjwqvwHiluEbkLV8ncjsIpnJe
Q1: 支持数万字的长语音生成吗?
A1: 支持。而且这也是设计目标之一。
认证作者

支持自启动