镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
数字人
WebUI
MultiTalk数字人优化加速版本-无限时长-唱歌/说话数字人
MultiTalk数字人优化加速版本-2步采样,对精度有要求修改采样数为4或者8
0/小时
v4.0

MultiTalk数字人优化加速版本使用教程

无限时长-唱歌数字人,说话数字人-2步采样,对精度有要求修改采样数为4或者8

镜像有自启动,实例初始化以后,等待服务启动,大概2分钟左右,随后点击SD-WebUI即可启动服务

WebUI界面如下:

image

上传人物的图片和驱动音频(支持口播和唱歌),写提示词(口播写正在说话,唱歌写正在唱歌),支持无限时长,平均30秒时长仅耗时500秒。

镜像信息
@刘悦的技术博客
已使用
14
镜像大小170GB
最近编辑2025-07-28
支持卡型
RTX40系48G RTX40系3090
+3
框架版本
PyTorch-2.7
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v4.0
2025-07-30
PyTorch:2.7 | CUDA:12.8 | 大小:170.00GB