登录
IndexTTS-V2 DeepSpeed编译加速版
支持异步批量任务,支持接口API并发请求,语速调节,音色保存,情绪控制
star86
0/小时
v3.0

IndexTTS-V2 DeepSpeed编译加速版

镜像简介

IndexTTS-V2 DeepSpeed编译加速版是一款高性能语音合成与克隆工具,通过DeepSpeed框架优化,显著提升了推理速度与并发处理能力。它支持异步批量任务与API并发请求,并具备精细的语速调节、音色保存及情绪控制功能,适用于高负载的语音内容生成、虚拟人配音、有声读物制作及个性化语音交互等场景。

功能支持

  • 支持异步批量任务
  • 支持接口API并发请求
  • 语速调节
  • 音色保存
  • 情绪控制

使用教程

1、创建实例并打开webui。该镜像支持自启动,初始化后,需要等待deepspeed编译启动,大概4分钟左右,可以输入命令 tail -50f /root/wan/webui.log 查看启动日志

2、随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可,支持批量任务

image

Web界面预览

image

支持接口请求

支持接口API的并发请求,接口格式:http://你的服务器公网ip:8188/?text=你好,我在这里测试一下&speaker=苏瑶&emo=情感参考/愤怒.wav

emo也可以是语义参数 emo=愤怒

刘悦的镜像交流官方社群

image

@刘悦的技术博客
刘悦的技术博客认证作者
镜像信息
已使用1833
运行时长
6744 H
支持自启动
镜像大小
90GB
最后更新时间
2026-02-02
支持卡型
RTX40系20803080Ti309048G RTX40系2080TiH20A800P40A100RTX50系V100SV100SV100S
+14
框架版本
PyTorch-2.7
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v3.0
2026-02-02
PyTorch:2.7 | CUDA:12.8 | 大小:90.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台