10顶级中文数字人套件集成了Easy-IndexTTS2、FireRedTTS与InfiniteTalk等先进模型,提供从声音克隆到动态视频生成的一站式解决方案。它能精准克隆目标音色并保留语气情感,同时将静态图片与驱动音频智能合成高质量、口型匹配的动态数字人视频,适用于虚拟主播、教育解说、企业宣传等多元化场景。 克隆目标声音,保留音色、语气与情感;将静态图片与音频驱动生成动态视频。
镜像作者视频:
建议租用48GB显存的4090



复制启动命令并运行
source myenv/bin/activate && python main.py --listen 0.0.0.0 --port 8188




认证作者
