优云智算
控制台
立即注册
新一代高质量语音生成模型VoxCPM 2.0 整合包升级了, 支持 30 种语言、9 种中文方言!
是 VoxCPM 系列的新一代语音生成模型,基于 2B 参数规模,并使用超过 200 万小时的多语言语音数据训练,支持 30 种语言、9 种中文方言
star0
0/小时
v1.0
最新

镜像名称

VoxCPM 2.0 新一代高质量语音生成模型,整合包升级了。

镜像简介

无需任何配置,一键运行,基于 2B 参数规模,并使用超过 200 万小时的多语言语音数据训练,支持 30 种语言、9 种中文方言,以及自然语言声音设计、可控声音克隆和高保真延续式克隆等能力。

配置方法

  1. 该镜像初始化后,需要等待服务启动,大概 3 分钟左右。
  2. 启动后点击按钮 “YZY启动器” 或者 “9000” 直接访问服务。
  3. 首次生成加载模型比较耗时。
  4. 服务运行日志查询,可以输入命令 tail -f /start.d/log/*
  5. 输出目录:/root/VoxCPM/outputs(可在浏览器中使用自带文件管理器访问) 云端YZY启动器.jpg 云端YZY启动器2.jpg

视频教程

详细步骤,可在 哔哩哔哩 余子越Talk 博主页面搜索 VoxCPM 观看视频教程!

相关链接

效果截图

云端.jpg 云端2.jpg

常见问题

@余子越Talk
余子越Talk认证作者
镜像信息
已使用2
运行时长
2 H
支持自启动
镜像大小
50GB
最后更新时间
2026-06-19
支持卡型
2080Ti309020803080Ti48G RTX40系RTX50系RTX40系
+7
框架版本
PyTorch-2.9.1
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-06-19
PyTorch:2.9.1 | CUDA:12.8 | 大小:50.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台