控制台

立即注册

Qwen3-TTS-AllinOne

Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS

0元/小时

v6.0

v4.0

v3.0

v2.0

v1.0

Qwen3-TTS-AllinOne

多人对话,智能多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS,修复内存泄露问题,增加长文本稳定性 v6.0 增加 NovaSr 模型，支持 48000hz 高品质输出音频文件，增加温度控制，增加音色模型列表接口

镜像简介

本镜像提供Qwen3-TTS-AllinOne一站式语音合成解决方案，支持多音字精准控制、英文数字智能纠音、批量任务处理及个性化音色保存。通过API接口调用，可稳定处理超长文本，兼容50系显卡，并具备语速调节功能。已优化内存管理，增强长文本合成稳定性，适合高质量有声内容、语音助手及大批量转写任务。

镜像操作指南

1、该镜像支持自启动，初始化后，需要等待服务启动，大概2分钟左右，可以输入命令 tail -50f /root/wan/log.txt 查看启动日志 2、随后点击 SD-WEBUI 按钮即可，上传音色文件或者选择音色，点击生成即可，支持批量任务

也可以调用在线接口

接口格式:http://你的实例ip:8188/?text=你好,测试一下&speaker=珊瑚其他参数:chunk=200 batch=8 speed=1 lang=English model=0.6B novasr=1 temperature=0.6

访问音色列表接口

http://你的实例ip:8188/speakers

支持excel批量任务

支持智能多音字,直接写拼音没问题，也可以中英混读: cao1 cao2 cao3 cao4 i only somke 0.8 zhong nan hai

也支持多人对话

最新支持 NovaSr 模型音频增强，支持 48000hz高品质输出

@刘悦的技术博客

认证作者

镜像信息

已使用392 次

运行时长

1491 H

支持自启动

镜像大小

130GB

最后更新时间

2026-02-27

支持卡型

RTX40系RTX50系48G RTX40系3080Ti3090A800

框架版本

PyTorch-2.8

CUDA版本

2.8

应用

JupyterLab: 8888

版本

v6.0

2026-02-27

PyTorch:2.8 | CUDA:2.8 | 大小:130.00GB

v4.0

2026-01-30

PyTorch:12.8 | CUDA:12.8 | 大小:110.00GB

v3.0

2026-01-28

PyTorch:2.8 | CUDA:12.8 | 大小:110.00GB

查看全部

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分