K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)一键部署

控制台

立即注册

K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)

多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成，还有 AI 角色分配.基础音色库及多语言.方言配音

0元/小时

v2.0

v1.0

镜像简介

本镜像基于 Web-TTS 项目构建，提供开箱即用的多角色AI配音解决方案。

功能：支持导入小说/剧本自动解析角色，集成 Qwen3-TTS 、 IndexTTs2等顶级模型进行多角色分轨配音，自动生成SRT字幕，支持单句音频批量打包下载。
特点：预装 PyTorch 2.10 + CUDA 12.8 深度学习环境，内置 WebUI 可视化界面，无需繁琐配置，启动即用，特别适合自媒体视频制作、广播剧生成等场景。

环境与依赖

本镜像已预置项目运行所需的完整环境：

框架及版本： PyTorch 2.10.0+cu128
CUDA版本： CUDA 12.8
其他依赖： Python 3.10, Gradio 6.4.0, FFmpeg, Transformers 4.57.3

配置方法

方法一

1.创建实例

2.选择合适的机型，立即部署

3.返回实例页面，点击以下按钮,即可进入操作页面

操作页面截图

方法二

启动服务进入实例终端（Terminal），执行以下命令启动 WebUI：
```
python webui.py
```
访问界面等待终端显示 Running on local URL: http://0.0.0.0:7860 后，点击平台提供的 API/Web链接（或通过公网IP+端口）即可打开操作界面。

环境验证代码

您可以在终端输入以下命令，验证 GPU 环境及核心库是否加载正常：

python -c "import torch; print
(f'Torch: {torch.__version__}, 
CUDA: {torch.version.cuda}, GPU: 
{torch.cuda.is_available()}')"

预期输出：显示 Torch 2.10.0+cu128 及 GPU 为 True

常见问题

Q1：启动后无法访问网页怎么办？ A1：请确保云平台已开放 7860 端口（TCP），或在启动时开启共享链接： python webui.py --share 。

Q2：生成长音频时显存不足（OOM）？ A2：多角色配音对显存有一定要求，建议使用 24GB 显存以上的 GPU 实例（如 RTX 3090/4090）。如遇显存不足，请尝试缩短单次生成的文本长度。

Q3：如何下载生成的音频？ A3： WebUI 界面底部提供了完整的音频播放器和下载按钮；勾选“保存每句音频并打包”后，还可下载包含所有分句素材的 ZIP 包。

@K哥讲AI

认证作者

镜像信息

已使用287 次

运行时长

5213 H

支持自启动

镜像大小

100GB

最后更新时间

2026-02-05

支持卡型

3080Ti48G RTX40系RTX50系RTX40系3090

框架版本

PyTorch-2.10.0

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v2.0

2026-02-05

PyTorch:2.10.0 | CUDA:12.8 | 大小:100.00GB

v1.0

2026-01-30

PyTorch:2.10.0 | CUDA:12.8 | 大小:100.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分