3本镜像基于邱锡鹏团队开源的MOSS-TTSD最新语音模型,该模型经过百万小时大规模训练,具备高质量的声音推理、合成与克隆能力。用户可通过少量音频样本快速复刻音色,生成自然流畅的个性化语音。适用于虚拟助手、有声内容创作及个性化语音服务等场景,提供开箱即用、完全免费的本地化语音AI解决方案。
1.创建实例

2.选择合适的机型,立即部署

3.打开控制面板的【webui】即可进入使用界面;

4.如果没有正常运行,请打开jupyterlab页面,进入终端,输入:
cd /root && bash run.sh
回车执行,等待类似:http://0.0.0.0:7860 出现,再返回控制台,打开webUI即可进入操作页面。
官方更新源码在这里:https://github.com/OpenMOSS/MOSS-TTSD
注意:因为项目使用到FlashAttention 加速技术,项目只能在NVIDIA 的 RTX 30 系列及以上的显卡机器上面运行。

认证作者

支持自启动