登录
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
star5
0/小时
v1.0

Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS

镜像简介

本镜像搭载TTS-1.7B语音合成系统,集成Flash-Attn加速技术,支持音色保存、API接口调用与超长文本处理,具备语速调节与音频超分降噪功能。可接入开源阅读工具,适用于语音助手、有声内容生成、播客制作及无障碍服务等场景,提供高效、灵活且音质清晰的文本转语音解决方案。

镜像使用教程

该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右

随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可 PixPin_2026-01-25_21-30-24.png 0.png

也支持音色设计和创造

1.png

支持接口调用

接口格式:

接口格式:http://你的实例ip:8188/?text=你好,测试一下&speaker=四川方言

其他参数:chunk batch speed

视频教程: https://www.bilibili.com/video/BV1UczkBFEDt/

@刘悦的技术博客
刘悦的技术博客认证作者
镜像信息
已使用51
运行时长
64 H
支持自启动
镜像大小
130GB
最后更新时间
2026-01-26
支持卡型
RTX40系RTX50系48G RTX40系3080Ti30902080TiA800
+7
框架版本
PyTorch-12.8
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-01-26
PyTorch:12.8 | CUDA:12.8 | 大小:130.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台