镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
语音
WebUI
数字人
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音字节开源 构建by科哥
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音
0/小时
v3.0

已经设置开机运行,【全部模型已经离线,开机即用!】加载运行需要一定时间

1、运行完成,加载完毕模型后,在控制台打开【webui】即可进入使用界面; image.png 2、卡顿时候,在控制台,实例【..】那里,点击【重启】,释放资源,等待完成启动,再次打开 【webui】即可进入使用界面;

3、更多高级指令,可以进入jupyterlab,自行操作,例如:

查看进程: ps -ef |grep python

终止进程: kill -9 pid

官方更新源码在这里: https://huggingface.co/spaces/mrfakename/MegaTTS3-Voice-Cloning https://github.com/bytedance/MegaTTS3

WavVAE模型: https://modelscope.cn/models/ACoderPassBy/MegaTTS-SFT


有bug请微信科哥: 312088415

mega-tts3通过几秒音频克隆声音 字节开源

镜像信息
@科哥AIGC
已使用
8
镜像大小60GB
最近编辑2025-08-07
支持卡型
3080TiRTX40系48G RTX40系30902080H20P40A100A800
+9
框架版本
PyTorch-2.0
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v3.0
2025-08-08
PyTorch:2.0 | CUDA:12.4 | 大小:60.00GB