8本镜像基于CosyVoice3语音合成与克隆系统,支持多音字精准控制、个性化音色保存及API流式调用,具备实时音频降噪能力。提供高质量的语音生成与复刻功能,适用于虚拟助手、有声内容制作、多场景交互语音及定制化语音服务。该环境目前可免费部署使用,助力用户轻松实现专业级语音AI应用集成。
该镜像支持自启动,创建实例,初始化后,需要等待服务编译启动,大概4分钟左右,可以输入命令 tail -50f /root/wan/cosyvoice.txt 查看启动日志
随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可

支持接口API调用
接口格式:http://你的实例ip地址:8188/?text=你好,测试一下&speaker=jok老师 其他参数:streaming=1&instruct=使用四川话

认证作者

支持自启动