登录
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
star3
0/小时
v1.0

Qwen3-TTS-0.6B,flash-attn加速,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS

镜像简介

本镜像搭载Qwen3-TTS-0.6B语音合成系统,集成flash-attn加速技术,推理速度提升显著,支持音色保存、API调用与超长文本处理。兼容50系显卡,具备语速调节、音频超分降噪等功能,并可对接开源阅读工具,适用于有声内容制作、语音助手、播客生成及无障碍服务等高质量文本转语音场景。

镜像使用教程

该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右

随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可 PixPin_2026-01-25_21-30-24.png 0.png

也支持音色设计

1.png

支持接口调用

接口格式:http://你的实例ip:8188/?text=你好,测试一下&speaker=陕西话 其他参数:chunk batch speed

2.png

@刘悦的技术博客
刘悦的技术博客认证作者
镜像信息
已使用22
运行时长
20 H
支持自启动
镜像大小
110GB
最后更新时间
2026-01-26
支持卡型
RTX40系RTX50系48G RTX40系3080Ti2080Ti3090A800
+7
框架版本
PyTorch-12.8
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-01-26
PyTorch:12.8 | CUDA:12.8 | 大小:110.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台