1VoxCPM2 ONNX版
主要用于语音合成,基于VoxCPM2的ONNX版本生成。
相比于PyTorch版本的VoxCPM2,性能有所提升,使用4090显卡测试的 RTF约在0.3左右。
换算成字数的话,千字大约40多秒, 当然这个数据取决于具体的测试方法,这里只做了简易测试,测试文件参考: https://wcnn68ei31q6.feishu.cn/wiki/HEAJwPFloiYEk9k89rtc5O7Bnhb
支持可控克隆、极致克隆、音色设计、查看文本切分、从视频中提取音频、查看音频元数据等操作,页面如下:
由于功能都比较简单,所以不再介绍其用法。

更多更及时的信息请 参考: https://wcnn68ei31q6.feishu.cn/wiki/HEAJwPFloiYEk9k89rtc5O7Bnhb
支持自启动,在 /worksapce目录中的 日志文件log.txt中看到 Running on http://0.0.0.0:7860 说明启动成功了。
Q1: 生成的音频如果没有及时下载,还能获取吗?
A1: 可以,在/worksapece的 outputs目录中下载即可。
认证作者

支持自启动