控制台

立即注册

咸鱼鱼VoxCPM

VoxCPM2

0元/小时

v2.02

VoxCPM2 语音合成镜像

镜像简介

基于 VoxCPM 2.02 的语音合成环境，支持零样本语音克隆、多语言语音生成。

功能： 零样本语音克隆（3-10秒参考音频）、30种语言语音合成、48kHz高音质输出
特点： 预装 VoxCPM 2.02 环境，支持一键启动 WebUI，开箱即用

环境与依赖

框架及版本： PyTorch 2.0+（基础镜像自带）
CUDA版本： CUDA 12.0
其他依赖： Python 3.12, Gradio, funasr 1.3.1

配置方法

部署实例后点击「WebUI」按钮一键启动
或 SSH 登录后执行：/start.d/voxcpm.sh
访问 http://实例IP:7860 使用界面

环境验证代码

pip show voxcpm  # 查看版本信息
python -c "import torch; print(torch.cuda.is_available())"  # 验证GPU可用

常见问题

Q1：WebUI 按钮无法连接？ A1： 确保发布时勾选了「支持自启动」，或手动执行 /start.d/voxcpm.sh 启动服务

Q2：端口被占用？ A2： 执行 pkill -f "python app.py" 停掉旧进程后重新启动

Q3：需要多少显存？ A3： 最低 24GB 显存（RTX 3090/4090

@后期咸鱼鱼-小帆

镜像信息

已使用103 次

运行时长

114 H

支持自启动

镜像大小

40GB

最后更新时间

2026-04-13

支持卡型

RTX40系

框架版本

PyTorch-py312

CUDA版本

11.8

应用

JupyterLab: 8888

版本

v2.02

2026-04-13

PyTorch:py312 | CUDA:11.8 | 大小:40.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分