17本镜像提供Qwen3-TTS-AllinOne一站式语音合成解决方案,支持多音字精准控制、英文数字智能纠音、批量任务处理及个性化音色保存。通过API接口调用,可稳定处理超长文本,兼容50系显卡,并具备语速调节功能。已优化内存管理,增强长文本合成稳定性,适合高质量有声内容、语音助手及大批量转写任务。
1、该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右,可以输入命令 tail -50f /root/wan/log.txt 查看启动日志
2、随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可,支持批量任务

也可以调用在线接口

接口格式:http://你的实例ip:8188/?text=你好,测试一下&speaker=珊瑚 其他参数:chunk=200 batch=8 speed=1 lang=English model=0.6B novasr=1 temperature=0.6
访问音色列表接口

支持excel批量任务

支持智能多音字,直接写拼音没问题,也可以中英混读: cao1 cao2 cao3 cao4 i only somke 0.8 zhong nan hai
也支持多人对话

最新支持 NovaSr 模型音频增强,支持 48000hz高品质输出

认证作者

支持自启动