优云智算
控制台
立即注册
MOSS-TTS-v1.5 音色克隆,文字转语音TTS,效果非常稳定,相似度高,支持30种语言,精准控制停顿,拼音,长参考音频+短目标文本的克隆更可靠!
支持任意时刻停顿:用户可以在文本中插入类似 [pause 3.2s] 的标记,精确控制语音中的停顿时长。更稳定的音色克隆.
star1
0/小时
v1.0
最新

镜像名称

MOSS-TTS-v1.5 音色克隆,文字转语音TTS,效果非常稳定,相似度高,支持30种语言,精准控制停顿,拼音,长参考音频+短目标文本的克隆更可靠!

镜像简介

无需任何配置,一键运行,然后通过公网IP访问生成服务。

1.支持任意时刻停顿:用户可以在文本中插入类似 [pause 3.2s] 的标记,精确控制语音中的停顿时长。

2.更强大的多语言性能:模型目前支持 31 种语言,覆盖中文、粤语、英语、日语、韩语、法语、德语、西班牙语、阿拉伯语、印地语、越南语、泰语等多种语言场景,适用于跨语言内容创作、国际化产品语音、教育、播客、有声内容和智能语音交互等应用。

3.更稳定的音色克隆 MOSS-TTS-v1.5 重点优化了音色克隆的一致性。对于需要反复生成同一角色、同一主播或同一品牌声音的场景,新版本在说话人相似度和多次生成稳定性上表现更好;同时,它对“长参考音频、短目标文本”的克隆场景更加可靠,降低了实际内容生产中的试错成本。

配置方法

  1. 该镜像初始化后,需要等待服务启动,大概 5 分钟左右。
  2. 启动后通过公网 IP 可以直接访问服务: http://a.b.c.d:7860
  3. 服务运行日志查询,可以输入命令 tail -f /start.d/log/*
  4. 输出目录:/root/MOSS-TTS/outputs(可在浏览器中使用自带文件管理器访问)

视频教程

详细步骤,可在 B站 余子越TalkTalk 博主页面搜索 MOSS-TTS 观看视频教程!

相关链接

效果截图

image.png

常见问题

@余子越Talk
余子越Talk认证作者
镜像信息
已使用10
运行时长
2 H
支持自启动
镜像大小
50GB
最后更新时间
2026-06-01
支持卡型
V100S48G RTX40系RTX50系
+3
框架版本
Miniconda-13.0
CUDA版本
12.8
应用
JupyterLab: 8888
自定义开放端口
7860
+1
版本
v1.0
2026-06-01
Miniconda:13.0 | CUDA:12.8 | 大小:50.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台