Wan2.2 S2V 数字人阿里通义千问出品

Wan2.2 S2V 数字人阿里通义千问出品这是一个音频驱动的电影视频生成模型

0元/小时

v1.1

v1.0

Wan2.2-S2V 数字人视频生成模型

Wan2.2-S2V阿里通义千问出品一个音频驱动的电影视频生成模型，极大地简化了视频制作过程，仅需提供一张静态图片和一段音频，模型便能生成面部表情自然、口型与音频高度一致、肢体动作流畅丝滑的电影级数字人视频。

Wan2.2-S2V支持分钟级长视频稳定生成，不止嘴动，手势、表情、姿态都能动。

使用教程

推荐选择4090、4090 48G

镜像信息

@十字鱼

认证作者

已使用146 次

运行时长

157 H

镜像大小

140GB

最后更新时间

2025-09-02

支持卡型

RTX40系20803080Ti309048G RTX40系2080TiH20A800P40A100RTX50系

+11

框架版本

PyTorch-2.7.0

CUDA版本

12.8

应用

JupyterLab: 8888

自定义开放端口

7860

版本

v1.1

2025-09-02

PyTorch:2.7.0 | CUDA:12.8 | 大小:140.00GB

v1.0

2025-08-28

PyTorch:2.7.0 | CUDA:12.8 | 大小:100.00GB