镜像社区
部署GPU实例
文档中心
常见问题(FAQ)
语音
其他
DDSP-SVC-6.2
ddsp6.2,内置环境,上传数据即可训练,支持批量推理。后续会更新。DDSP-SVC-6.2是轻量级端到端歌声转换开源框架,基于DDSP+Rectified Flow双路径建模,推理显存≤4G即可实时变声,训练速度十倍于SO-VITS,集成RMVPE基频提取、NSF-HiFiGAN声码器、内容编码器一键切换,支持多人混合音色、滑窗交叉淡入、SOLA低延迟拼接,附赠Gradio GUI与预训练模型,开箱即唱。
0/小时
v1.0

DDSP-SVC 6.2

DDSP-SVC项目地址:https://github.com/yxlllc/DDSP-SVC/
觉得还不错的话,如果可以还请给项目点个star⭐
镜像作者:bilibili@kiss丿冷鸟鸟
邮箱:2649406963@qq.com

交流群:829974025

有问题可以bilibili私信或者留言,或者加群

2025/1/15

  • 更新ddsp6.2(旧模型不再兼容)


模型位于 DDSP-SVC/exp/reflow-test文件夹中,名称为 model_xxx.pt xxx为你训练的步数(step) 配置文件和模型位于同一目录 名为config.yml

训练前的准备


目前镜像默认进行单个说话人的训练,多说话人训练请查看仓库的数据集放置格式
数据集是一些短音频片段,如果你已经有数据集,则将数据集放置于DDSP-SVC/data/train/audio/目录内
因为暂时没底模,所以推荐数据集最好有两三个小时吧,一个小时我没试过


DDSP训练速度非常快,几分钟就可以试听了,训练时长不建议太长
训练的配置文件是 DDSP-SVC/configs/reflow.yaml ,小白不建议乱修改
训练后如果想要下载模型和配置文件进行本地推理,下载 model_xxxx 和 config.yml 即可
推理所需要的显卡要求应该特别低,不过最低配置是什么我没测试过

使用教程(详细教程可以参考JupyterLab中的“DDSP-SVC使用.ipynb”这个文件)

预处理

#进入项目文件夹
%cd /workspace/workdir/DDSP-SVC
#将底模复制到模型目录下
#无底模训练可不执行这条(暂无底模)
#%cp pretrain/model_0.pt exp/reflow-test/
#划分验证集
!python draw.py
#预处理
!python preprocess.py -c configs/reflow.yaml

训练

# 主模型训练
# 目前镜像默认单个说话人的训练,多说话人请查看仓库的数据集放置格式
%cd /workspace/workdir/DDSP-SVC
!python train_reflow.py -c configs/reflow.yaml

推理

目前支持批量推理
将你的音频放入DDSP-SVC/raw文件夹中 推理结果位于DDSP-SVC/results文件夹中
模型文件和配置文件位于DDSP-SVC/exp/reflow-test文件夹中
默认为模型名称为model_10000.pt
请将其修改为你自己想要推理的模型名称
更多推理参数请自行查看仓库
https://github.com/yxlllc/DDSP-SVC/blob/6.2/cn_README.md
将下面的model_name改为你自己想推理的模型

%cd /workspace/workdir/DDSP-SVC
#修改这个model_name为你想推理的模型参数👇
model_name = 'model_4000.pt'
#这个是采样器👇 "euler" "rk4"
method = 'euler'
!python infers.py -m  {model_name} -method {method}
#启动tensorboard
#模型训练靠机器,效果如何自己听 tensorboard并不是万能的,不能过于相信上面的参数
!ps -ef | grep tensorboard | awk '{print $2}' | xargs kill -9
!tensorboard --port 6006 --logdir /workspace/workdir/DDSP-SVC/exp/reflow-test/logs

打包模型和配置文件

打包后的模型在autodl-tmp/workdir文件夹中

#打包模型到workdir文件夹
!zip -r  /workspace/workdir/DDSP6.2模型及配置文件.zip  /workspace/workdir/DDSP-SVC/exp/reflow-test/
镜像信息
@39c5bb
已使用
170
镜像大小20GB
最近编辑2025-01-21
支持卡型
RTX40系48G RTX40系2080
+3
框架版本
PyTorch-2.0.1
CUDA版本
11.8
应用
JupyterLab: 8888
版本
v1.0
2025-07-14
PyTorch:2.0.1 | CUDA:11.8 | 大小:20.00GB