模型介绍:
StableAvatar 是复旦大学、微软亚洲研究院等推出的创新音频驱动虚拟形象视频生成模型。 模型通过端到端的视频扩散变换器,结合时间步感知音频适配器、音频原生引导机制和动态加权滑动窗口策略,能生成无限长度的高质量虚拟形象视频。模型解决了现有模型在长视频生成中出现的身份一致性、音频同步和视频平滑性问题,显著提升生成视频的自然度和连贯性,适用虚拟现实、数字人创建等场景。
1、选择本镜像创建实例,推荐选择4090 GPU进行部署
2、实例创建后,选择Jupyterlab打开
1、打开jupyter左侧的启动器:
2、点击启动双箭头启动按钮:
3、查看启动进度,运行完成后返回控制台打开SD-WebUI
4、返回控制面板打开“SD-WebUI”
ps -ef |grep python
kill -9 pid
cd /root && bash run.sh
https://kege-aigc.feishu.cn/docx/L3FVdQl7kom8Ckx7QiicQj2VnEd
科哥已经借助ai工具【claude code cli】,在线云端和本地修复,重写很多ai开源应用
效率非常给力!
修复一般的开源应用简直就是开挂了一样,需要修复和搭建ai应用欢迎联系!