DDSP-SVC-6.2

ddsp6.2,内置环境，上传数据即可训练，支持批量推理。后续会更新。DDSP-SVC-6.2是轻量级端到端歌声转换开源框架，基于DDSP+Rectified Flow双路径建模，推理显存≤4G即可实时变声，训练速度十倍于SO-VITS，集成RMVPE基频提取、NSF-HiFiGAN声码器、内容编码器一键切换，支持多人混合音色、滑窗交叉淡入、SOLA低延迟拼接，附赠Gradio GUI与预训练模型，开箱即唱。

0元/小时

v1.0

DDSP-SVC 6.2

DDSP-SVC项目地址:https://github.com/yxlllc/DDSP-SVC/
觉得还不错的话，如果可以还请给项目点个star⭐
镜像作者:bilibili@kiss丿冷鸟鸟
邮箱:2649406963@qq.com
交流群:829974025
有问题可以bilibili私信或者留言，或者加群

2025/1/15

更新ddsp6.2(旧模型不再兼容)

模型位于 DDSP-SVC/exp/reflow-test文件夹中，名称为 model_xxx.pt xxx为你训练的步数(step) 配置文件和模型位于同一目录名为config.yml

训练前的准备

目前镜像默认进行单个说话人的训练，多说话人训练请查看仓库的数据集放置格式
数据集是一些短音频片段，如果你已经有数据集，则将数据集放置于DDSP-SVC/data/train/audio/目录内
因为暂时没底模，所以推荐数据集最好有两三个小时吧，一个小时我没试过

DDSP训练速度非常快，几分钟就可以试听了，训练时长不建议太长
训练的配置文件是 DDSP-SVC/configs/reflow.yaml ，小白不建议乱修改
训练后如果想要下载模型和配置文件进行本地推理，下载 model_xxxx 和 config.yml 即可
推理所需要的显卡要求应该特别低，不过最低配置是什么我没测试过

使用教程（详细教程可以参考JupyterLab中的“DDSP-SVC使用.ipynb”这个文件）

预处理

#进入项目文件夹
%cd /workspace/workdir/DDSP-SVC
#将底模复制到模型目录下
#无底模训练可不执行这条(暂无底模)
#%cp pretrain/model_0.pt exp/reflow-test/
#划分验证集
!python draw.py
#预处理
!python preprocess.py -c configs/reflow.yaml

训练

# 主模型训练
# 目前镜像默认单个说话人的训练，多说话人请查看仓库的数据集放置格式
%cd /workspace/workdir/DDSP-SVC
!python train_reflow.py -c configs/reflow.yaml

推理

目前支持批量推理
将你的音频放入DDSP-SVC/raw文件夹中推理结果位于DDSP-SVC/results文件夹中
模型文件和配置文件位于DDSP-SVC/exp/reflow-test文件夹中
默认为模型名称为model_10000.pt
请将其修改为你自己想要推理的模型名称
更多推理参数请自行查看仓库
https://github.com/yxlllc/DDSP-SVC/blob/6.2/cn_README.md
将下面的model_name改为你自己想推理的模型

%cd /workspace/workdir/DDSP-SVC
#修改这个model_name为你想推理的模型参数👇
model_name = 'model_4000.pt'
#这个是采样器👇 "euler" "rk4"
method = 'euler'
!python infers.py -m  {model_name} -method {method}

#启动tensorboard
#模型训练靠机器，效果如何自己听 tensorboard并不是万能的，不能过于相信上面的参数
!ps -ef | grep tensorboard | awk '{print $2}' | xargs kill -9
!tensorboard --port 6006 --logdir /workspace/workdir/DDSP-SVC/exp/reflow-test/logs

打包模型和配置文件

打包后的模型在autodl-tmp/workdir文件夹中

#打包模型到workdir文件夹
!zip -r  /workspace/workdir/DDSP6.2模型及配置文件.zip  /workspace/workdir/DDSP-SVC/exp/reflow-test/

@39c5bb

认证作者

镜像信息

已使用253 次

运行时长

99 H

镜像大小

20GB

最后更新时间

2025-07-14

支持卡型

RTX40系20803080Ti309048G RTX40系2080TiH20A800P40A100RTX50系

+11

框架版本

PyTorch-2.0.1

CUDA版本

11.8

应用

JupyterLab: 8888

版本

v1.0

2025-07-14

PyTorch:2.0.1 | CUDA:11.8 | 大小:20.00GB