登录
WAN2.2-S2V最新版数字人+动作参考
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
4
0/小时
v1.0

Wan2.2-S2V 数字人音+图生视频模型

阿里通义万相开源的一款以音频驱动生成视频的AI模型,它能通过一张图片+音频来生成一段口型同步,表情神态,肢体动作流畅自然的高质量视频,并且支持多种语言.

B站视频教程

https://www.bilibili.com/video/BV1FxYTzsERV/?vd_source=7d2c1f3a3525c71b349a0f4da45eeadc#reply115156914801252

镜像使用文档:

01 查找镜像

点击镜像社区,在搜索框内输入S2V,点击社恐的知识树制作的S2V镜像 搜索镜像.png

02 部署镜像

点击使用该镜像创建实例 使用镜像.png

03 创建容器实例

点击部署GPU实例,选择镜像,建议优先选用 4090 48G显卡,可以直接生成更大的分辨率视频,并且不容易爆显存,点击下方立即部署. 选择镜像和显卡1.png

04 启动云服务器

立即部署完成后会自动跳转到控制台,选择已部署的镜像实例点击启动点击启动.png

05 运行ComfyUI

启动完成后,点击红色框内"ComfyUI"进入前端操作页面,点击蓝色框内“JupyterLab”进入后台文件夹页面,如果点击ComfyUI没反应,请刷新页面 进入前端.png

06 查找内置ComfyUI工作流

加载工作流.png

07 如何下载已经生成的文件到本地电脑

首先点击“JupyterLab”进入后台文件夹,其中Input是上传文件存放的位置,比如图片音频视频等,output文件夹是所有生成文件存放的位置 打开后台文件夹.png 点击进入output文件夹,选中要下载的文件,右键点击弹出窗口选这下载即可 下载输出文件.png

欢迎加入社恐的知识树-作者交流群

镜像信息
@社恐的知识树
社恐的知识树认证作者
已使用53
运行时长
81 H
镜像大小
100GB
最后更新时间
2025-09-06
支持卡型
RTX40系20803080Ti309048G RTX40系2080TiH20A800P40A100RTX50系
+11
框架版本
PyTorch-2.8.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-09-06
PyTorch:2.8.0 | CUDA:12.8 | 大小:100.00GB