登录
K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)
多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成,还有 AI 角色分配.基础音色库及多语言.方言配音
star3
0/小时
v2.0
v1.0

镜像简介

本镜像基于 Web-TTS 项目构建,提供开箱即用的 多角色AI配音 解决方案。

  • 功能: 支持导入小说/剧本自动解析角色,集成 Qwen3-TTS 、 IndexTTs2等顶级模型进行多角色分轨配音,自动生成SRT字幕,支持单句音频批量打包下载。
  • 特点: 预装 PyTorch 2.10 + CUDA 12.8 深度学习环境,内置 WebUI 可视化界面,无需繁琐配置,启动即用,特别适合自媒体视频制作、广播剧生成等场景。

环境与依赖

本镜像已预置项目运行所需的完整环境:

  • 框架及版本: PyTorch 2.10.0+cu128
  • CUDA版本: CUDA 12.8
  • 其他依赖: Python 3.10, Gradio 6.4.0, FFmpeg, Transformers 4.57.3

配置方法

方法一

1.创建实例

image.png

2.选择合适的机型,立即部署

image.png

3.返回实例页面,点击以下按钮,即可进入操作页面 image.png

操作页面截图

image.png

方法二

  1. 启动服务 进入实例终端(Terminal),执行以下命令启动 WebUI:
    python webui.py
    
  2. 访问界面 等待终端显示 Running on local URL: http://0.0.0.0:7860 后,点击平台提供的 API/Web链接 (或通过公网IP+端口)即可打开操作界面。

环境验证代码

您可以在终端输入以下命令,验证 GPU 环境及核心库是否加载正常:

python -c "import torch; print
(f'Torch: {torch.__version__}, 
CUDA: {torch.version.cuda}, GPU: 
{torch.cuda.is_available()}')"

预期输出:显示 Torch 2.10.0+cu128 及 GPU 为 True

常见问题

Q1:启动后无法访问网页怎么办? A1: 请确保云平台已开放 7860 端口(TCP),或在启动时开启共享链接: python webui.py --share 。

Q2:生成长音频时显存不足(OOM)? A2: 多角色配音对显存有一定要求,建议使用 24GB 显存以上的 GPU 实例(如 RTX 3090/4090)。如遇显存不足,请尝试缩短单次生成的文本长度。

Q3:如何下载生成的音频? A3: WebUI 界面底部提供了完整的音频播放器和下载按钮;勾选“保存每句音频并打包”后,还可下载包含所有分句素材的 ZIP 包。

@K哥讲AI
镜像信息
已使用30
运行时长
22 H
支持自启动
镜像大小
100GB
最后更新时间
2026-02-05
支持卡型
3080Ti48G RTX40系RTX50系RTX40系3090
+5
框架版本
PyTorch-2.10.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v2.0
2026-02-05
PyTorch:2.10.0 | CUDA:12.8 | 大小:100.00GB
v1.0
2026-01-30
PyTorch:2.10.0 | CUDA:12.8 | 大小:100.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台