登录
LiveAvatar
流式实时音频驱动头像生成,无限长度
0
0/小时
v1.0

LiveAvatar

实例启动后,需要等待3分钟加载模型!

Live Avatar 是一个算法-系统协同设计的框架,能够实现实时、流式、无限长度的交互式虚拟形象视频生成。基于一个 14B 参数的扩散模型,它在 5×H800 GPU 上使用 4 步采样时能达到 20 FPS,并支持块状自回归处理,可生成超过 10,000 秒的流式视频。

默认启动是单卡,并不能做到流式输出。可尝试多卡部署后,换用多卡命令启动。

使用教程

0. 麻烦右上角点个收藏~

318e364f-9c65-489c-9391-b3fb6cd49c26.png

1. 在镜像详情界面点击“使用该镜像创建实例”

image.png

2. 选择GPU型号,此项目需要显存≥80G的卡,再点击“立即部署”

image.png

3. 实例启动后,在控制台中点击“SD-WebUI”

image.png

4.浏览器如图显示,就说明启动成功了

image.png

5.如果页面无响应(比如此项目需要预加载模型,启动时间较长),点击“JupyterLab”,再双击log.txt可查看启动进度

image.png image.png

6.如果有报错的话,请下载log.txt发到下面的交流群中

image.png

十字鱼-镜像作者交流群

image

镜像信息
@十字鱼
十字鱼认证作者
支持自启动
已使用1
运行时长
0 H
镜像大小
90GB
最后更新时间
2025-12-16
支持卡型
A800H20A100
+3
框架版本
PyTorch-2.8.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-12-16
PyTorch:2.8.0 | CUDA:12.8 | 大小:90.00GB