0PilotTTS 高德开源语音克隆,8G显存可用,支持 11 种情感、14 种方言的 LLM TTS 系统
PilotTTS 是一套基于大语言模型的开源 TTS 系统,核心特点是"有意简化的架构 + 严格的数据工程"。它提供完全开源的数据处理流水线,支持零样本音色克隆、11 类情感控制、笑/呼吸等副语言标记,以及 14 种中文方言的跨方言合成。在 Seed-TTS 测试集上达到 0.862 的说话人相似度与 0.87% 的 CER。基于 Qwen3-0.6B 构建,Apache-2.0 协议。
详细步骤,可在 哔哩哔哩 余子越Talk 博主页面搜索 高德PilotTTS 观看视频教程!

认证作者
支持自启动