镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
Wan2.2-S2V-14B: 音频驱动的电影视频生成
通过音频驱动的图片转视频生成软件,支持声音克隆功能
0
0/小时
v1.0

Wan2.2-S2V-14B: 音频驱动的图片转视频生成

通过一段音频素材和图片生成一个全新的人物讲话视频,人物说话内容就是音频素材内容,可实现音唇同步

1、首先点击右侧蓝色按钮【使用该镜像创建实例】

2、GPU选择48G或是96G型号,低显存会导致报错终止,点击下方蓝色按钮【立即部署】

3、稍等一两分钟后实例便会运行,显示【运行中】后继续等待1分钟左右初始化,再点击右侧【SD-WebUI】按钮,即可打开WebUI操作界面

image.png

注意

音频素材文件时长最好不要太长

如果使用声音克隆功能,音频样本建议3-10秒

镜像信息
@AI画师大阳
支持自启动
已使用2
运行时长
0 H
镜像大小
120GB
最后更新时间
2025-09-08
支持卡型
3080Ti48G RTX40系H20
+3
框架版本
PyTorch-2.8.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-09-08
PyTorch:2.8.0 | CUDA:12.8 | 大小:120.00GB