镜像社区
部署GPU实例
模型API服务
文档中心
常见问题(FAQ)
登录
VibeVoice:富有表现力的长篇多人对话语音合成工具
富有表现力的长篇多人对话语音合成工具
5
0
元/小时
v2.0
v1.0
VibeVoice:富有表现力的长篇多人对话语音合成工具
VibeVoice可以合成非常自然逼真的长篇音频内容,同时可以合成对话,支持1-4个发音人,
2.0版本支持上传音频文件自定义克隆声音,2.0使用的是7B模型
使用教程
1、首先点击右侧蓝色按钮【使用该镜像创建实例】
2、选择合适的GPU型号。然后点击下方蓝色按钮【立即部署】
3、稍等一两分钟后实例便会运行,显示【运行中】后请继续等待两三分钟左右初始化,再点击右侧【打开WebUI】按钮,即可打开WebUI操作界面
注意事项
软件只支持中英文语音合成
软件会随机合成一些背景乐,这是由场景决定的,如果想要删除,请修改出现背景乐处的文本内容
@AI画师大阳
认证作者
使用该镜像创建实例
分享镜像
镜像信息
已使用
41 次
运行时长
117 H
支持自启动
镜像大小
90GB
最后更新时间
2025-11-14
支持卡型
3090
RTX50系
RTX40系
48G RTX40系
+4
框架版本
PyTorch-2.8.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v2.0
2025-11-14
PyTorch:2.8.0 | CUDA:12.8 | 大小:90.00GB
v1.0
2025-11-24
PyTorch:2.8.0 | CUDA:12.8 | 大小:90.00GB