5本镜像搭载轻量高效的Ming-omni-tts-0.5B语音模型,提供标准API接口调用,支持超长文本合成、细腻情感控制与流畅的中英文混读能力,兼容50系显卡。适用于智能语音助手、有声内容创作、跨语言交互及多媒体配音等场景,为用户提供高质量的一站式语音AI解决方案。
1、该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右,可以输入命令 tail -50f /root/wan/log.txt 查看启动日志
2、随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可

3 也支持接口请求
接口格式:http://你的实例ip:8188/?text=你好,测试一下&speaker=老男人 其他参数:speed=1 lang=English novasr=1 instruct={"情感":"高兴"}

认证作者

支持自启动