镜像社区
部署GPU实例
文档中心
常见问题(FAQ)
WebUI
语音
F5-TTS
F5-TTS 是由上海交通大学、剑桥大学和吉利汽车研究院(宁波)有限公司于 2024 年共同开源的一款高性能文本到语音 (TTS) 系统, 它基于流匹配的非自回归生成方法,结合了扩散变换器 (DiT) 技术。 1、一切环境已经就绪,开机已经启动应用,等待1-2分钟即可打开webUI进入使用页面: 2、如果需要重启程序,进入jupyterlab,终端命令行中输入: cd /root && run.sh 并回车,等待1-2分钟即可打开webUI进入使用页面. 官方更新源码在这里: https://github.com/SWivid/F5-TTS 使用视频及教程参考:B站搜索“F5-tts”相关视频教程 使用教程更新地址:https://kege-aigc.feishu.cn/docx/G5G1dcRUForkdnxhuQLcmsuknTb --- 有bug请微信科哥: 312088415 科哥目前在研究AI数字人直播卖货很成功,欢迎来了解一起玩: https://kege-aigc.feishu.cn/docx/G271dgZr1o8CvMx9KKrcRuuonDf
0/小时
v1.0

F5-TTS 极速3秒克隆声音 支持大模型对话模式

镜像由科哥构建 微信:312088415

镜像使用教程

该镜像已经设置开机运行

1. 一切环境已经就绪,开机已经启动应用,待实例初始化完成后,等待1-2分钟即可打开webUI进入使用页面:

image

进入使用页面为如下画面:

image

2. 如果需要重启程序,进入jupyterlab,终端命令行中输入:

cd /root && run.sh

并回车,等待1-2分钟即可打开webUI进入使用页面.

官方更新源码在这里: https://github.com/SWivid/F5-TTS
使用视频及教程参考:B站搜索“F5-tts”相关视频教程
使用教程更新地址:https://kege-aigc.feishu.cn/docx/G5G1dcRUForkdnxhuQLcmsuknTb


有bug请微信科哥: 312088415 科哥目前在研究AI数字人直播卖货很成功,欢迎来了解一起玩: https://kege-aigc.feishu.cn/docx/G271dgZr1o8CvMx9KKrcRuuonDf

科哥在UCLoud的镜像列表【不断更新中】: https://kege-aigc.feishu.cn/docx/L3FVdQl7kom8Ckx7QiicQj2VnEd

镜像信息
@科哥AIGC
已使用
11
镜像大小70GB
最近编辑2025-05-26
支持卡型
RTX40系3080Ti3090P40A100A80048G RTX40系
+7
框架版本
PyTorch-2.0
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.0
2025-06-17
PyTorch:2.0 | CUDA:12.4 | 大小:70.00GB
优云智算 | F5-TTS一键部署