IndexTTS-V2 DeepSpeed编译加速版
镜像简介
IndexTTS-V2 DeepSpeed编译加速版是一款高性能语音合成与克隆工具,通过DeepSpeed框架优化,显著提升了推理速度与并发处理能力。它支持异步批量任务与API并发请求,并具备精细的语速调节、音色保存及情绪控制功能,适用于高负载的语音内容生成、虚拟人配音、有声读物制作及个性化语音交互等场景。
功能支持
- 支持异步批量任务
- 支持接口API并发请求
- 语速调节
- 音色保存
- 情绪控制
使用教程
1、创建实例并打开webui。该镜像支持自启动,初始化后,需要等待deepspeed编译启动,大概4分钟左右,可以输入命令 tail -50f /root/wan/webui.log 查看启动日志
2、随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可,支持批量任务

Web界面预览

支持接口请求
支持接口API的并发请求,接口格式:http://你的服务器公网ip:8188/?text=你好,我在这里测试一下&speaker=苏瑶&emo=情感参考/愤怒.wav
emo也可以是语义参数 emo=愤怒
刘悦的镜像交流官方社群
