0VoxCPM2tts 是一个支持 30+ 种语言的高质量 TTS(文字转语音)工具,支持声音克隆与 LoRA 训练,效果出色,尤其适合中文使用场景。
云端环境已预配置好所有依赖,无需额外安装。
| 功能 | 说明 |
|---|
| Ultimate Cloning | 完整声音克隆,效果最佳 ✅ 推荐 |
| Controllable Cloning | 可调节风格、情感、节奏的克隆 |
| Voice Design (VS Design) | 描述性语音生成,需填写性别、年龄、语速等参数 |
| Text to Speech | 纯文字转语音,不做克隆 |
注意: 日语在 Voice Design 模式下效果欠佳,建议使用中文。
start_index(开始秒数)和 duration(时长秒)mode 为 Ultimate Clone音频无需完整上传,截取片段效果更好;5 分钟以上的音频建议直接训练 LoRA。
⚠️ 文件名注意大小写:Linux 环境下
.wav必须小写
train.json路径:my_comfy → models → lora → VoxCPM
文件大小约 276 MB,可右键下载到本地保存。
在 Testing 区域找到 LoRA Line 节点,选中刚训练的 LoRA 文件,直接运行即可测试效果。
