优云智算
控制台
立即注册
PilotTTS 高德开源语音克隆,8G显存可用,支持 11 种情感、14 种方言的 LLM TTS 系统
PilotTTS 是一套基于大语言模型的开源 TTS 系统,核心特点是"有意简化的架构 + 严格的数据工程"。它提供完全开源的数据处理流水线,支持零样本音色克隆。
star0
0/小时
v1.0
最新

镜像名称

PilotTTS 高德开源语音克隆,8G显存可用,支持 11 种情感、14 种方言的 LLM TTS 系统

镜像简介

PilotTTS 是一套基于大语言模型的开源 TTS 系统,核心特点是"有意简化的架构 + 严格的数据工程"。它提供完全开源的数据处理流水线,支持零样本音色克隆、11 类情感控制、笑/呼吸等副语言标记,以及 14 种中文方言的跨方言合成。在 Seed-TTS 测试集上达到 0.862 的说话人相似度与 0.87% 的 CER。基于 Qwen3-0.6B 构建,Apache-2.0 协议。

配置方法

  1. 该镜像初始化后,需要等待服务启动,大概 2 分钟左右。
  2. 启动后通过公网 IP 可以直接访问服务: http://a.b.c.d:9000
  3. 服务运行日志查询,可以输入命令 tail -f /start.d/log/*
  4. 输出目录:/root/PilotTTS/outputs(可在浏览器中使用自带文件管理器访问)

视频教程

详细步骤,可在 哔哩哔哩 余子越Talk 博主页面搜索 高德PilotTTS 观看视频教程!

相关链接

效果截图

云端截图.png

常见问题

@余子越Talk
余子越Talk认证作者
镜像信息
已使用0
运行时长
0 H
支持自启动
镜像大小
50GB
最后更新时间
2026-06-05
支持卡型
V100SA100P40H20A80030902080Ti3080Ti48G RTX40系RTX40系RTX50系2080
+12
框架版本
PyTorch-2.4.0
CUDA版本
12.4
应用
JupyterLab: 8888
自定义开放端口
9000
+1
版本
v1.0
2026-06-05
PyTorch:2.4.0 | CUDA:12.4 | 大小:50.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台