控制台

立即注册

新一代高质量语音生成模型VoxCPM 2.0 整合包升级了，支持 30 种语言、9 种中文方言！

是 VoxCPM 系列的新一代语音生成模型，基于 2B 参数规模，并使用超过 200 万小时的多语言语音数据训练，支持 30 种语言、9 种中文方言

0元/小时

v1.0

镜像名称

VoxCPM 2.0 新一代高质量语音生成模型，整合包升级了。

镜像简介

无需任何配置，一键运行，基于 2B 参数规模，并使用超过 200 万小时的多语言语音数据训练，支持 30 种语言、9 种中文方言，以及自然语言声音设计、可控声音克隆和高保真延续式克隆等能力。

配置方法

该镜像初始化后，需要等待服务启动，大概 3 分钟左右。
启动后点击按钮 “YZY启动器” 或者 “9000” 直接访问服务。
首次生成加载模型比较耗时。
服务运行日志查询，可以输入命令 tail -f /start.d/log/*
输出目录：/root/VoxCPM/outputs（可在浏览器中使用自带文件管理器访问）

视频教程

详细步骤，可在哔哩哔哩余子越Talk 博主页面搜索 VoxCPM 观看视频教程！

效果截图

云端.jpg 云端2.jpg

常见问题

@余子越Talk

认证作者

镜像信息

已使用2 次

运行时长

2 H

支持自启动

镜像大小

50GB

最后更新时间

2026-06-19

支持卡型

2080Ti309020803080Ti48G RTX40系RTX50系RTX40系

框架版本

PyTorch-2.9.1

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.0

2026-06-19

PyTorch:2.9.1 | CUDA:12.8 | 大小:50.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分