登录
StableAvatar快速生成对口型数字人视频 12gb显卡爆改by科哥
对口型数字人视频wan2.1优化项目 12gb显卡爆改by科哥
0
0/小时
v1.1

StableAvatar快速生成对口型数字人视频

模型介绍:

StableAvatar 是复旦大学、微软亚洲研究院等推出的创新音频驱动虚拟形象视频生成模型。 模型通过端到端的视频扩散变换器,结合时间步感知音频适配器、音频原生引导机制和动态加权滑动窗口策略,能生成无限长度的高质量虚拟形象视频。模型解决了现有模型在长视频生成中出现的身份一致性、音频同步和视频平滑性问题,显著提升生成视频的自然度和连贯性,适用虚拟现实、数字人创建等场景。

使用教程

创建实例

1、选择本镜像创建实例,推荐选择4090 GPU进行部署

image.png

2、实例创建后,选择Jupyterlab打开

image

启动应用

1、打开jupyter左侧的启动器:

image.png

2、点击启动双箭头启动按钮:

image.png

3、查看启动进度,运行完成后返回控制台打开SD-WebUI

image.png

4、返回控制面板打开“SD-WebUI”

image.png

SD-WebUI运行使用界面截图

image.png

image.png

image.png

bug反馈可以加入科哥专属群交流➕ 广告勿进!

描述图片内容

更多高级指令,可以进入jupyterlab,自行操作,例如:

  • 查看进程:
ps -ef |grep python
  • 终止进程:
kill -9 pid
  • 重启程序:
cd  /root && bash run.sh

有bug请微信科哥或加群: 312088415

科哥在UCloud镜像列表【不断更新中】:

image.png

镜像信息
@科哥AIGC
科哥AIGC认证作者
已使用2
运行时长
0 H
镜像大小
130GB
最后更新时间
2025-09-30
支持卡型
3090RTX40系48G RTX40系3080TiH20P40A100A800
+8
框架版本
PyTorch-2.8
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.1
2025-09-30
PyTorch:2.8 | CUDA:12.8 | 大小:130.00GB