23在线一键训练 AI翻唱SVC模型,支持多种显卡型号部署,支持上传压缩文件,支持无人值守依次训练主模型、扩散模型、聚类模型,支持训练完成发送通知提醒,支持网页端一键打包训练好的模型,无需多余的命令行和文件移动,由网页端自动处理,支持网页端一键清空训练环境,追求的就是超高效率 。
SVC 4.1-Stable v2.3.18 整合包搭建ctrl+c结束reference_loss参数可供参考(如G_12000_32_02.pth 表示训练步数12000步时,reference_loss为32.02)
1.点击直达镜像链接:一键部署:SVC-WebUI
2.在此页面右侧点击使用该镜像创建实例

3.在新页面选择配置以及付费方式后,点击立即部署

4.开机后,等待左侧显示运行中。再等待1分钟左右,再点击JupyterLab按钮进入后台如下图,如果超过5分钟没显示运行中,点旁边的重启,重新等待。

如何关闭网页翻译?-->页面翻译选项选择:更多 - 一律不翻译此网站
运行 WebUI:
点击快速开始.ipynb标签,点击选中启动webui的代码框,前面会出现一条蓝色方块(🟦),在窗口上面的工具栏,有一个像“播放”符号(▶)的按钮,点它!
等待片刻 
控制台会输出一个公网IP链接,点击即可访问WebUI界面。
启动tensorboard的代码框,前面会出现一条蓝色方块(🟦),在窗口上面的工具栏,有一个像“播放”符号(▶)的按钮,点它!
等待片刻
控制台会输出一个公网IP链接,点击即可访问TensorBoard界面。(训练素材需要是30分钟以上的唱歌音频,可以是多个文件,包含高中低音各声线,安静环境录制不要加混响)
a.1. 上传原始音频: 将您的原始音频文件(例如歌曲干声、录音等)上传到以下目录:
/workspace/workdir/so-vits-svc/a_slicer_fold/
您可以直接拖动音频文件上传到这个目录,也可以上传一个 .zip 压缩包。

a.2. 切片方法:
小工具/实验室特性 标签页。智能音频切片 子标签。原始音频文件夹 输入框中,确保路径为 /workspace/workdir/so-vits-svc/a_slicer_fold/ (通常保持默认)。加载原始音频 按钮。系统会识别 a_slicer_fold/ 中的文件,并自动为您建议一个 输出目录 (例如 dataset_raw/speaker0) 。人声降噪设置。 修改后需要点击 应用降噪设置 按钮 (主要按钮) 保存降噪配置。 (已经默认勾选)。切片的最长秒数 和 切片的最短秒数 (推荐默认值 15 和 4)。开始切片 按钮。输出信息 中会显示切片结果的统计信息。切片后的音频将自动保存到 dataset_raw/speaker0/ 目录下。 
(已经切片的意思是你已经在本地客户端切成了5-15秒左右的片段。如果不熟悉切片流程,建议用上面的方式,即:直接上传录音文件,由系统切片)
b.1 如果切片素材是压缩文件 (.zip):
b.1.1. 上传压缩包: 将包含您已切片音频的 .zip 压缩包上传到以下目录:
/workspace/workdir/so-vits-svc/dataset_raw/

压缩包内部结构要求:
推荐: 压缩包内应该包含一个文件夹(例如 /speaker0/),speaker0 文件夹内是已经切片5-15秒左右的wav格式音频文件。
示例:
your_dataset.zip
├───speaker0/
│ ├───audio_001.wav
│ ├───audio_002.wav
│ └───...

b.2 如果素材是切好片的单个音频文件:
b.2.1. 上传文件:
在/workdir/so-vits-svc/dataset_raw/下面新建说话人目录,(例如 speaker0)
将您已切片音频上传到以下目录:
/workdir/so-vits-svc/dataset_raw/speaker0/
目录内部结构要求:
.wav 音频文件。 dataset_raw/
└───speaker0/
├───audio_001.wav
├───audio_002.wav
└───...
训练 标签页。
原始数据集目录识别结果 显示正确。选择训练使用的编码器 和 选择训练使用的f0预测器(一般情况下保持默认即可)。是否使用浅扩散模型、是否启用响度嵌入和音量增强、是否启用TINY训练(一般情况下保持默认即可)。数据预处理 按钮。预处理输出信息 是否有报错。 
训练 标签页,检查并调整 填写训练设置和超参数 部分的参数(如无特殊需求,可以保持默认)。扩散模型配置 并调整相关参数(如无特殊需求,可以保持默认)。将当前设置保存成默认设置 和 写入配置文件 按钮。 
主模型目标步数 、 扩散模型目标步数钉钉机器人 Access Token开始一键训练 即可自动依次训练

从头训练主模型 按钮 或 继续上一次的训练进度 按钮,后台会开始训练主模型,可在快速开始.ipynb查看训练进度,如下图“step: 1400, reference_loss: 35.6618, lr: 9.827740075511432e-05”,代表1400步。训练步数要看数据集质量,推荐1万步以上。
从头训练扩散模型 按钮或 继续训练扩散模型 按钮。您可以通过以下几种方式下载训练好的模型:
推理 标签页。 (先确保推理标签下当前模式:工作目录模式,将从'./logs/44k'读取模型文件,如不是,需要在页面底端切换模式)
模型打包 部分。打包模型名称 输入框中填写您希望的模型名称(例如 1.speaker0)这里的命名是为了避免不同模型文件导入本地SVC客户端时,产生的模型文件重名。打包当前选择的模型 按钮。 
下载打包文件 区域会出现一个可下载的 .zip 文件链接,点击即可下载。前往以下目录下载您的模型文件:
/workspace/workdir/so-vits-svc/logs/44k
在线训练模型目录结构:
/workspace/workdir/so-vits-svc/logs/44k/
├───diffusion/(扩散模型目录)
│ ├───model_步数.pt(扩散模型,在扩散模型目录)
│ ├───config.yaml(扩散模型配置文件,在扩散模型目录)
├───G_步数.loss参数.pth(G开头的主模型)
├───config.json(主模型配置文件)
└─── xxx_kmeans_10000.pt(聚类模型)
推荐使用客户端:winscp 或其他 SFTP 工具。
连接到您的镜像实例,然后前往以下目录下载您的模型文件:
/workspace/workdir/so-vits-svc/logs/44k
在线训练模型目录结构
/workspace/workdir/so-vits-svc/logs/44k/
├───diffusion/(扩散模型目录)
│ ├───model_步数.pt(扩散模型,在扩散模型目录)
│ ├───config.yaml(扩散模型配置文件,在扩散模型目录)
├───G_步数.loss参数.pth(G开头的主模型)
├───config.json(主模型配置文件)
└─── xxx_kmeans_10000.pt(聚类模型)
方法一:小工具/实验室特性找到模型导入和导出(或者也叫模型发布与打包) 导入刚下载的模型压缩包

方法二:解压下载的模型文件压缩包,将models目录复制到本地svc的models目录 本地SVC客户端模型目录结构:
/so-vits-svc/models/
├───diffusion/(扩散模型目录)
│ ├───model_步数.pt(扩散模型,在扩散模型目录)
├───G_步数.loss参数.pth(主模型)
├───config.json(主模型配置文件)
├───xxx_kmeans_10000.pt(聚类模型)
└───config.yaml(扩散模型配置文件)
警告:此操作将删除以下目录中的所有内容,请务必提前备份重要数据!
/workspace/workdir/so-vits-svc/logs/44k/ (So-VITS模型和日志)/workspace/workdir/so-vits-svc/dataset_raw/ (原始数据集)/workspace/workdir/so-vits-svc/dataset/ (预处理后的数据集)/workspace/workdir/so-vits-svc/raw/ (原始音频,如果存在)/workspace/workdir/so-vits-svc/results/ (推理结果)/workspace/workdir/so-vits-svc/a_slicer_fold/ (切片工具临时目录)/workspace/workdir/so-vits-svc/models_backup/ (历史模型训练备份目录)/workspace/workdir/so-vits-svc/release_packs/ (模型打包临时目录).ipynb_checkpoints 目录请在模型下载完成并检查无误后再执行此操作。
操作步骤: 
清空训练环境 标签页。清空训练环境 按钮 (主要按钮)。清空环境输出信息 文本框中,您将看到清理过程的日志。



认证作者