登录
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
star17
0/小时
v6.0
最新
v4.0
v3.0
v2.0
v1.0

Qwen3-TTS-AllinOne,多人对话,智能多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS,修复内存泄露问题,增加长文本稳定性 v6.0 增加 NovaSr 模型,支持 48000hz 高品质输出音频文件,增加温度控制,增加音色模型列表接口

镜像简介

本镜像提供Qwen3-TTS-AllinOne一站式语音合成解决方案,支持多音字精准控制、英文数字智能纠音、批量任务处理及个性化音色保存。通过API接口调用,可稳定处理超长文本,兼容50系显卡,并具备语速调节功能。已优化内存管理,增强长文本合成稳定性,适合高质量有声内容、语音助手及大批量转写任务。

镜像操作指南

1、该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右,可以输入命令 tail -50f /root/wan/log.txt 查看启动日志

2、随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可,支持批量任务

PixPin_2026-01-26_18-34-47.png

也可以调用在线接口

2.png

接口格式:http://你的实例ip:8188/?text=你好,测试一下&speaker=珊瑚 其他参数:chunk=200 batch=8 speed=1 lang=English model=0.6B novasr=1 temperature=0.6

访问音色列表接口

http://你的实例ip:8188/speakers

PixPin_2026-02-16_21-14-57.png

支持excel批量任务

PixPin_2026-01-27_17-38-24.png

支持智能多音字,直接写拼音没问题,也可以中英混读: cao1 cao2 cao3 cao4 i only somke 0.8 zhong nan hai

也支持多人对话

PixPin_2026-01-30_19-28-54.png

最新支持 NovaSr 模型音频增强,支持 48000hz高品质输出

PixPin_2026-02-16_20-07-36.png

@刘悦的技术博客
刘悦的技术博客认证作者
镜像信息
已使用15
运行时长
11 H
支持自启动
镜像大小
130GB
最后更新时间
2026-02-16
支持卡型
RTX40系RTX50系48G RTX40系3080Ti3090A800
+6
框架版本
PyTorch-2.8
CUDA版本
2.8
应用
JupyterLab: 8888
版本
v6.0
2026-02-16
PyTorch:2.8 | CUDA:2.8 | 大小:130.00GB
v4.0
2026-01-30
PyTorch:12.8 | CUDA:12.8 | 大小:110.00GB
v3.0
2026-01-28
PyTorch:2.8 | CUDA:12.8 | 大小:110.00GB
查看全部
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台