镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
通义
数字人
ComfyUI
Wan2.2 S2V 数字人 阿里通义千问出品
Wan2.2 S2V 数字人 阿里通义千问出品 这是一个音频驱动的电影视频生成模型
0/小时
v1.0

Wan2.2-S2V 数字人视频生成模型

Wan2.2-S2V阿里通义千问出品 一个音频驱动的电影视频生成模型,极大地简化了视频制作过程,仅需提供一张静态图片和一段音频,模型便能生成面部表情自然、口型与音频高度一致、肢体动作流畅丝滑的电影级数字人视频。

Wan2.2-S2V支持分钟级长视频稳定生成,不止嘴动,手势、表情、姿态都能动。

使用教程

1. 在镜像详情界面点击“使用该镜像创建实例”

a3e42afc-93c4-452f-ac54-39fe0a31da63.png

2. 选择GPU型号,再点击“立即部署”

推荐选择4090、4090 48G

c0104f21-bb0d-429b-88b2-d3200dac0a18.png

3. 实例启动后,在控制台-应用中点击“JupyterLab”

1752828859198.jpg

4.打开JupyterLab页面后,按照数字顺序依次执行——打开ipynb文件、点击快速启动的代码、点击运行按钮

微信截图_20250612160851.png

5.如下图所示,则启动成功

6b806c64-ea5e-49ec-8f78-69d3dae6b61e.png

6.输入网址http://{ip地址}:7860访问,{ip地址}替换为下图所示地址

1752828906489.jpg

7.浏览器如图显示,就说明启动成功了

8f6d1412-2cd5-4a10-9b36-7b06956533c1.png

8.提示

8.1 工作流可以在工作流程中找到

image.png

8.2 按照数字顺序,先上传图片,再根据图片修改分辨率。然后上传视频或音频,根据长度修改总帧数(比如5s的长度就是5x16+1=81帧)

image.png

8.3 视频素材传到这个文件夹里

18e05a5d-e8f3-4f40-b8c4-33c0b0e8c665.png 3975ae4e-de01-481c-b8e5-1cce49726eee.png

十字鱼-镜像作者交流群

image

镜像信息
@十字鱼
已使用
5
镜像大小100GB
最近编辑2025-08-28
支持卡型
RTX40系48G RTX40系3090H20P40A100A8003080Ti
+8
框架版本
PyTorch-2.7.0
CUDA版本
12.8
应用
JupyterLab: 8888
自定义开放端口
7860
+1
版本
v1.0
2025-08-28
PyTorch:2.7.0 | CUDA:12.8 | 大小:100.00GB