Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS

镜像简介

本镜像搭载TTS-1.7B语音合成系统，集成Flash-Attn加速技术，支持音色保存、API接口调用与超长文本处理，具备语速调节与音频超分降噪功能。可接入开源阅读工具，适用于语音助手、有声内容生成、播客制作及无障碍服务等场景，提供高效、灵活且音质清晰的文本转语音解决方案。

该镜像支持自启动，初始化后，需要等待服务启动，大概2分钟左右

随后点击 SD-WEBUI 按钮即可，上传音色文件或者选择音色，点击生成即可

也支持音色设计和创造

接口格式:

其他参数:chunk batch speed

@刘悦的技术博客

认证作者

镜像信息

已使用119 次

运行时长

174 H

支持自启动

镜像大小

130GB

最后更新时间

2026-01-26

支持卡型

RTX40系RTX50系48G RTX40系3080Ti30902080TiA800

框架版本

PyTorch-12.8

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.0

2026-01-26

PyTorch:12.8 | CUDA:12.8 | 大小:130.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

产品

快速入口

镜像合集