镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
可以一次性合成4人的对话播客
0
0/小时
v1.0

VibeVoice – 微软推出的开源文本转语音模型

使用教程

已经设置开机运行,【全部模型已经离线,开机即用!】加载运行需要一定时间

1、运行完成,加载完毕模型后,在控制台打开【webui】即可进入使用界面;

image.png

  • 【webui】进入使用界面; image.png

image.png

2、卡顿时候,在控制台,实例【..】那里,点击【重启】,释放资源,等待完成启动,再次打开 【webui】即可进入使用界面;

3、更多高级指令,可以进入jupyterlab,自行操作,例如:

查看进程: ps -ef |grep python

终止进程: kill -9 pid


有bug请微信科哥: 312088415


科哥在UCloud镜像列表:

镜像信息
@科哥AIGC
已使用1
运行时长
0 H
镜像大小
70GB
最后更新时间
2025-09-08
支持卡型
3090RTX40系3080Ti48G RTX40系H20P40A100A800
+8
框架版本
PyTorch-2.7
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.0
2025-09-08
PyTorch:2.7 | CUDA:12.4 | 大小:70.00GB
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥一键部署 | 优云智算