登录
LatentSync1.5数字人视频制作v1.5.3
LatentSync1.5是字节跳动2025年3月开源的端到端唇形同步框架,基于潜在扩散模型,仅用6 GB显存即可将任意音频驱动成高分辨率、时序连贯的中文说话视频
1
0/小时
v1.6
v1.0
  • 已经设置开机运行程序,启动需要等待 1-2分钟才可以打开WebUI

日志请查看:jupyterlab那边:/root/logs.log文件 直接打开WebUI进行操作即可 官方更新源码在这里: https://github.com/bytedance/LatentSync

运行界面

laten20250722_121115_859.png

laten2t_20250722_121144_582.png


- 有bug请微信科哥: 312088415


科哥目前在研究AI数字人直播卖货很成功,欢迎来了解一起玩:

https://kege-aigc.feishu.cn/docx/G271dgZr1o8CvMx9KKrcRuuonDf

科哥在UCLoud的镜像列表【不断更新中】:

https://kege-aigc.feishu.cn/docx/L3FVdQl7kom8Ckx7QiicQj2VnEd

镜像信息
@科哥AIGC
科哥AIGC认证作者
支持自启动
已使用91
运行时长
112 H
镜像大小
70GB
最后更新时间
2025-07-22
支持卡型
RTX40系3080Ti48G RTX40系30902080H20P40A100A8005090
+10
框架版本
PyTorch-2.0
CUDA版本
11.8
应用
JupyterLab: 8888
版本
v1.6
2025-07-22
PyTorch:2.0 | CUDA:11.8 | 大小:70.00GB
v1.0
2025-07-14
PyTorch:2.0 | CUDA:cuda12.1 | 大小:60.00GB