5本镜像搭载TTS-1.7B语音合成系统,集成Flash-Attn加速技术,支持音色保存、API接口调用与超长文本处理,具备语速调节与音频超分降噪功能。可接入开源阅读工具,适用于语音助手、有声内容生成、播客制作及无障碍服务等场景,提供高效、灵活且音质清晰的文本转语音解决方案。
该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右
随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可

也支持音色设计和创造

接口格式:
接口格式:http://你的实例ip:8188/?text=你好,测试一下&speaker=四川方言
其他参数:chunk batch speed
认证作者

支持自启动