镜像名称

VoxCPM2雨落版整合包

镜像简介

功能： 这个镜像使用VoxCPM2模型进行语音生成，支持单角色极致克隆、单角色可控克隆、音色设计、多角色对话模式、批量Excel模式、根据字幕文件生成等功能，而且还支持查看内部原理、提取音频、查看音频元信息等。
特点： 支持业务场景非常多、是一个非常好用的提效工具。

环境与依赖

本镜像构建和运行所需的基础环境。

框架及版本： PyTorch2.8
CUDA版本： CUDA12.8，支持50系显卡
其他依赖： Python 3.10，官方推荐版本之一

使用教程

在镜像社区中找到对应的镜像，可以搜索"雨落"这个关键字，注意是VoxCPM2，不是VoxCPM1.5。
在部署之后等待一会即可进入到webui界面，如果想了解如何查看启动日志，请参考:https://wcnn68ei31q6.feishu.cn/wiki/A1RjwqvwHiluEbkLV8ncjsIpnJe 这个文档里面的3.1这一节。

3.启动成功后默认操作页面如下（可以看到为非常多的业务场景设置了很贴心的功能）: 4. 而且还支持查看内部原理，不管是词表部分，还是长文本切分，亦或是里面的语音降噪，都有展示。当然最重要的或许还是文本规范化，如下展示: 5.而且还贴心的准备了从视频中提取音频的功能，如下: 6.同时还支持查看音频文件的信息，如下: