镜像社区
部署GPU实例
文档中心
常见问题(FAQ)
数字人
ComfyUI
最强图片数字人Multitalk唱歌说话(支持长视频)
最强的图片数字人,支持唱歌、说话,效果超强!
0/小时
v25.711

Multitalk(支持长视频) 镜像使用教程

1、在镜像详情界面点击“使用该镜像创建实例”,如没有注册平台,可先注册登录。

image.png

2、选择GPU型号(推荐24G显存或48G显存),再点击“立即部署”。

PS:该模型较大,请根据视频长度选择合适显存的显卡。

(1) 40s视频需要至少24G显存,80s视频需要至少32G显存,48G显存预估能生成100s视频。

(2) 如果视频长度超过100s,建议先本地剪辑音频,分段生成即可。每段剪辑长度根据(1)中的显卡显存。

image.png

3. 工作流在comfyui左侧,打开即用。支持单人、多人(最多4人)说话、唱歌。

image.png

镜像信息
@与AI同行
已使用
14
镜像大小150GB
最近编辑2025-07-12
支持卡型
RTX40系48G RTX40系
+2
框架版本
PyTorch-Torch2.7.1
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v25.711
2025-07-12
PyTorch:Torch2.7.1 | CUDA:12.8 | 大小:150.00GB