优云智算
控制台
立即注册
VoxCPM2雨落版整合包
VoxCPM2雨落版整合包,支持多种业务场景
star0
0/小时
v1.0
最新

镜像名称

VoxCPM2雨落版整合包

镜像简介

  • 功能: 这个镜像使用VoxCPM2模型进行语音生成,支持单角色极致克隆、单角色可控克隆、音色设计、多角色对话模式、批量Excel模式、根据字幕文件生成等功能,而且还支持查看内部原理、提取音频、查看音频元信息等。
  • 特点: 支持业务场景非常多、是一个非常好用的提效工具。

环境与依赖

本镜像构建和运行所需的基础环境。

  • 框架及版本: PyTorch2.8
  • CUDA版本: CUDA12.8,支持50系显卡
  • 其他依赖: Python 3.10,官方推荐版本之一

使用教程

  1. 在镜像社区中找到对应的镜像,可以搜索"雨落"这个关键字,注意是VoxCPM2,不是VoxCPM1.5。
  2. 在部署之后等待一会即可进入到webui界面,如果想了解如何查看启动日志,请参考:https://wcnn68ei31q6.feishu.cn/wiki/A1RjwqvwHiluEbkLV8ncjsIpnJe 这个文档里面的3.1这一节。

3.启动成功后默认操作页面如下(可以看到为非常多的业务场景设置了很贴心的功能): image.png 4. 而且还支持查看内部原理,不管是词表部分,还是长文本切分,亦或是里面的语音降噪,都有展示。当然最重要的或许还是文本规范化,如下展示: image.png 5.而且还贴心的准备了从视频中提取音频的功能,如下: image.png 6.同时还支持查看音频文件的信息,如下: image.png

环境验证

该镜像支持自动启动,启动日志可以去JupyterLab中的/workspace目录下的log.txt查看,启动成功的日志如下: image.png 如果还是不明白如何操作,详情参考: https://wcnn68ei31q6.feishu.cn/wiki/A1RjwqvwHiluEbkLV8ncjsIpnJe

每个场景的使用指南

常见问题

Q1: 支持数万字的长语音生成吗?
A1: 支持。而且这也是设计目标之一。

@雨落实战
雨落实战认证作者
镜像信息
已使用1
运行时长
0 H
支持自启动
镜像大小
50GB
最后更新时间
2026-04-17
支持卡型
RTX40系RTX50系48G RTX40系30903080Ti
+5
框架版本
PyTorch-2.8.0
CUDA版本
128
应用
JupyterLab: 8888
版本
v1.0
2026-04-17
PyTorch:2.8.0 | CUDA:128 | 大小:50.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台