优云智算
控制台
立即注册
SVC-Fusion_api_rvc
支持了rvc模型算法的SVC-Fusion_api
star0
0/小时
v1.0
最新

SVCFusion - 语音转换训练系统

SVCFusion 是一个集成多种 SVC(Singing Voice Conversion)模型的训练和推理系统,支持 So-VITS-SVC、DDSP-SVC、Reflow-VAE-SVC 和 RVC 等模型。

功能特性

  • 多模型支持: So-VITS-SVC, DDSP-SVC 6.1/6.3, Reflow-VAE-SVC, RVC
  • 完整训练流程: 数据预处理 → 模型训练 → 自动打包
  • 音频降噪: 集成 MSST 降噪模型
  • 云端存储: MinIO 对象存储集成
  • 队列系统: Redis 任务队列,支持异步训练
  • Web API: FastAPI RESTful API
  • 训练 GUI: PyQt6 图形界面

快速开始

1. 环境要求

  • Python 3.10+
  • CUDA 11.8+ (GPU 训练)
  • Redis (任务队列)
  • MinIO (可选,用于云端存储)

2. 安装依赖

pip install -r requirements.txt

3. 启动服务

启动 API 服务器

python api_server.py

服务将在 http://localhost:8090 启动

启动训练 GUI

python rvc_training_gui.py

4. 开始训练

使用 GUI 或 API 提交训练任务:

import requests

response = requests.post(
    "http://localhost:8090/api/pipeline/start_async",
    json={
        "model_type_index": 4,  # RVC
        "form": {
            "minio_audio_files": [{"key": "audio/file.wav"}],
            "spk_name": "我的模型",
            "total_epoch": 500
        }
    }
)

task_id = response.json()["task_id"]
print(f"训练任务已启动: {task_id}")

文档

主要文档

归档文档

详细的修复说明和技术文档位于 docs/archive/ 目录:

  • RVC_COMPLETE_FIX_SUMMARY.md - 完整修复总结
  • RVC_SINGLE_GPU_FIX.md - 单GPU训练修复
  • RVC_MUTE_SAMPLES_FIX.md - Mute样本文件修复
  • RVC_PARAMETER_FIX.md - 参数传递修复
  • RVC_DIRECTORY_MISMATCH_FIX.md - 目录不匹配修复

测试脚本

测试脚本位于 docs/tests/ 目录:

  • test_rvc_api.py - API 测试
  • test_rvc_complete_flow.py - 完整流程测试
  • verify_rvc_integration.py - 集成验证

项目结构

SVCFusion/
├── api_server.py              # API 服务器入口
├── rvc_training_gui.py        # 训练 GUI
├── SVCFusion/                 # 核心代码
│   ├── models/                # 模型实现
│   │   ├── rvc.py            # RVC 模型
│   │   ├── sovits.py         # So-VITS-SVC 模型
│   │   └── ...
│   ├── api/                   # API 路由和处理器
│   │   ├── routers/          # FastAPI 路由
│   │   └── queue/            # 任务队列
│   └── ...
├── rvc/                       # RVC 核心代码
│   ├── infer/                # 推理和训练
│   └── ...
├── docs/                      # 文档
│   ├── RVC_TRAINING_GUIDE.md # 训练指南
│   ├── archive/              # 归档文档
│   └── tests/                # 测试脚本
└── pretrained/               # 预训练模型
    ├── rvc/                  # RVC 预训练模型
    ├── sovits/               # So-VITS-SVC 预训练模型
    └── ...

RVC 训练系统

已修复的问题

RVC 训练系统已完成以下修复:

  1. ✅ filelist.txt 格式错误(5字段)
  2. ✅ 单GPU分布式训练初始化失败
  3. ✅ mute样本文件缺失
  4. ✅ 预训练模型路径错误
  5. ✅ 批次大小过大(CUDA OOM)
  6. ✅ 训练参数命名不一致
  7. ✅ 预处理与训练目录不匹配

详细说明见 RVC 训练指南

训练参数

参数默认值说明
采样率48kHz自动配置
批次大小2016GB 显存优化
训练轮数500可自定义 1-5000
保存间隔50 轮自动配置
F0 提取RMVPEGPU 加速

目录结构

训练数据和模型保存在:

rvc/logs/{模型名称}/
├── 0_gt_wavs/          # 原始音频
├── 1_16k_wavs/         # 重采样音频
├── 2a_f0/              # F0 特征
├── 2b-f0nsf/           # F0 NSF 特征
├── 3_feature768/       # HuBERT 特征
├── filelist.txt        # 训练列表
├── config.json         # 配置文件
├── G_*.pth             # 生成器检查点
├── D_*.pth             # 判别器检查点
└── added_*.index       # FAISS 索引

API 接口

训练接口

POST /api/pipeline/start_async

启动训练任务

{
  "model_type_index": 4,
  "form": {
    "minio_audio_files": [{"key": "audio/file.wav"}],
    "spk_name": "模型名称",
    "total_epoch": 500,
    "use_denoise": false,
    "auto_pack": true
  }
}

GET /api/queue/status/{task_id}

查询任务状态

GET /api/queue/result/{task_id}

获取任务结果

下载接口

GET /api/pipeline/download/minio?bucket={bucket}&key={key}

从 MinIO 下载打包模型

故障排查

常见问题

1. 训练秒完成

原因: 使用了相同的模型名称,从旧检查点恢复

解决: 使用不同的模型名称,或删除旧目录

2. FileNotFoundError

原因: 预处理和训练目录不匹配

解决: 已修复,确保使用最新代码

3. CUDA out of memory

原因: 显存不足

解决:

  • 已降低 batch_size 到 20
  • 减少训练数据
  • 使用更大显存的 GPU

4. numba 错误

原因: numba 版本不兼容

解决:

pip install "numba==0.59.1" --force-reinstall

更多问题见 RVC 训练指南

开发

运行测试

# API 测试
python docs/tests/test_rvc_api.py

# 完整流程测试
python docs/tests/test_rvc_complete_flow.py

# 集成验证
python docs/tests/verify_rvc_integration.py

代码结构

  • SVCFusion/models/ - 模型实现
  • SVCFusion/api/ - API 接口
  • SVCFusion/api/queue/ - 任务队列
  • rvc/ - RVC 核心代码

贡献

欢迎提交 Issue 和 Pull Request!

许可证

本项目基于多个开源项目构建,请参考各子项目的许可证。

致谢


最后更新: 2026-04-28

@杭州
镜像信息
已使用2
运行时长
4 H
支持自启动
镜像大小
40GB
最后更新时间
2026-04-28
支持卡型
2080TiRTX40系RTX50系48G RTX40系3080Ti30902080H20A800P40V100SA100
+12
框架版本
PyTorch-2.8.0
CUDA版本
12.8
应用
JupyterLab: 8888
自定义开放端口
8090
+1
版本
v1.0
2026-04-28
PyTorch:2.8.0 | CUDA:12.8 | 大小:40.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台