镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
WAN2.2-S2V最新版数字人+动作参考
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
0
0/小时
v1.0

Wan2.2-S2V 数字人音+图生视频模型

阿里通义万相开源的一款以音频驱动生成视频的AI模型,它能通过一张图片+音频来生成一段口型同步,表情神态,肢体动作流畅自然的高质量视频,并且支持多种语言.

镜像使用文档:

01 创建容器实例

点击部署GPU实例,选择镜像,建议优先选用 4090 48G显卡,可以直接生成更大的分辨率视频,并且不容易爆显存,点击下方立即部署. 选择镜像和显卡1.png

02 启动云服务器

立即部署完成后会自动跳转到控制台,选择已部署的镜像实例点击启动点击启动.png

03 运行ComfyUI

启动完成后,点击红色框内"ComfyUI"进入前端操作页面,点击蓝色框内“JupyterLab”进入后台文件夹页面,如果点击ComfyUI没反应,请刷新页面 进入前端.png

04 查找内置ComfyUI工作流

加载工作流.png

欢迎加入社恐的知识树-作者交流群

镜像信息
@社恐的知识树
已使用0
运行时长
0 H
镜像大小
100GB
最后更新时间
2025-09-05
支持卡型
RTX40系48G RTX40系
+2
框架版本
PyTorch-2.8.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-09-05
PyTorch:2.8.0 | CUDA:12.8 | 大小:100.00GB
WAN2.2-S2V最新版数字人+动作参考一键部署 | 优云智算