优云智算
控制台
立即注册
咸鱼鱼VoxCPM
VoxCPM2
star0
0/小时
v2.02
最新

VoxCPM2 语音合成镜像

镜像简介

基于 VoxCPM 2.02 的语音合成环境,支持零样本语音克隆、多语言语音生成。

  • 功能: 零样本语音克隆(3-10秒参考音频)、30种语言语音合成、48kHz高音质输出
  • 特点: 预装 VoxCPM 2.02 环境,支持一键启动 WebUI,开箱即用

环境与依赖

  • 框架及版本: PyTorch 2.0+(基础镜像自带)
  • CUDA版本: CUDA 12.0
  • 其他依赖: Python 3.12, Gradio, funasr 1.3.1

配置方法

  1. 部署实例后点击「WebUI」按钮一键启动
  2. 或 SSH 登录后执行:/start.d/voxcpm.sh
  3. 访问 http://实例IP:7860 使用界面

环境验证代码

pip show voxcpm  # 查看版本信息
python -c "import torch; print(torch.cuda.is_available())"  # 验证GPU可用

相关链接

常见问题

Q1:WebUI 按钮无法连接? A1: 确保发布时勾选了「支持自启动」,或手动执行 /start.d/voxcpm.sh 启动服务

Q2:端口被占用? A2: 执行 pkill -f "python app.py" 停掉旧进程后重新启动

Q3:需要多少显存? A3: 最低 24GB 显存(RTX 3090/4090

@后期咸鱼鱼-小帆
镜像信息
已使用2
运行时长
3 H
支持自启动
镜像大小
40GB
最后更新时间
2026-04-13
支持卡型
RTX40系
+1
框架版本
PyTorch-py312
CUDA版本
11.8
应用
JupyterLab: 8888
版本
v2.02
2026-04-13
PyTorch:py312 | CUDA:11.8 | 大小:40.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台