5本镜像基于LTX-2模型与GGUF高效格式,通过RapID加速技术,支持将单张人物图片转换为口型精准、动作自然的无限时长数字人视频,并集成高质量语音合成,实现音画同步。适用于虚拟主播、短视频创作、在线教育及动态内容生成等场景,提供一站式、零成本的AI数字人生产解决方案。
1、该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右,可以输入命令 tail -50f /root/wan/log.txt 查看启动日志
2、随后点击 SD-WEBUI 按钮即可,上传图片和音频,点击生成即可,支持批量任务

认证作者

支持自启动