登录
VoxCPM-来自面壁智能和清华的语音生成模型
几秒音频即可克隆声音 构建by科哥
3
0/小时
v1.0

VoxCPM-来自面壁智能和清华的语音生成模型

模型介绍:

VoxCPM是面壁智能于2025年9月18日发布的0.5B参数尺寸开源语音生成基座模型,该模型在语音合成的自然度、音色相似度和韵律表现力方面达到SOTA水平,能够通过少量数据克隆特定音色。其技术支持根据文本内容自动匹配合适的声音类型与情感基调,实现智能化的语音生成。模型参数规模为0.5B,在保持轻量化的同时实现高质量的语音输出。

使用教程

1、选择本镜像创建实例,推荐选择4090 GPU进行部署

2、实例创建后等待2分钟,选择SD-WebUI打开

image

WebUI运行使用界面截图

image.png

image.png

image.png

bug反馈可以加入科哥专属群交流!

描述图片内容

有bug请微信科哥: 312088415


科哥在UCloud镜像列表【不断更新中】:

image.png

镜像信息
@科哥AIGC
科哥AIGC认证作者
支持自启动
已使用19
运行时长
16 H
镜像大小
40GB
最后更新时间
2025-09-30
支持卡型
RTX40系20803080Ti309048G RTX40系2080TiH20A800P40A100RTX50系
+11
框架版本
PyTorch-2.4
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.0
2025-09-30
PyTorch:2.4 | CUDA:12.4 | 大小:40.00GB