3本镜像基于 Web-TTS 项目构建,提供开箱即用的 多角色AI配音 解决方案。
本镜像已预置项目运行所需的完整环境:
1.创建实例

2.选择合适的机型,立即部署

3.返回实例页面,点击以下按钮,即可进入操作页面


python webui.py
您可以在终端输入以下命令,验证 GPU 环境及核心库是否加载正常:
python -c "import torch; print
(f'Torch: {torch.__version__},
CUDA: {torch.version.cuda}, GPU:
{torch.cuda.is_available()}')"
预期输出:显示 Torch 2.10.0+cu128 及 GPU 为 True
Q1:启动后无法访问网页怎么办? A1: 请确保云平台已开放 7860 端口(TCP),或在启动时开启共享链接: python webui.py --share 。
Q2:生成长音频时显存不足(OOM)? A2: 多角色配音对显存有一定要求,建议使用 24GB 显存以上的 GPU 实例(如 RTX 3090/4090)。如遇显存不足,请尝试缩短单次生成的文本长度。
Q3:如何下载生成的音频? A3: WebUI 界面底部提供了完整的音频播放器和下载按钮;勾选“保存每句音频并打包”后,还可下载包含所有分句素材的 ZIP 包。

支持自启动