DDSP-SVC项目地址:https://github.com/yxlllc/DDSP-SVC/
觉得还不错的话,如果可以还请给项目点个star⭐
镜像作者:bilibili@kiss丿冷鸟鸟
邮箱:2649406963@qq.com
交流群:829974025
有问题可以bilibili私信或者留言,或者加群
2025/1/15
模型位于 DDSP-SVC/exp/reflow-test文件夹中,名称为 model_xxx.pt xxx为你训练的步数(step)
配置文件和模型位于同一目录 名为config.yml
训练前的准备
目前镜像默认进行单个说话人的训练,多说话人训练请查看仓库的数据集放置格式
数据集是一些短音频片段,如果你已经有数据集,则将数据集放置于DDSP-SVC/data/train/audio/目录内
因为暂时没底模,所以推荐数据集最好有两三个小时吧,一个小时我没试过
DDSP训练速度非常快,几分钟就可以试听了,训练时长不建议太长
训练的配置文件是 DDSP-SVC/configs/reflow.yaml ,小白不建议乱修改
训练后如果想要下载模型和配置文件进行本地推理,下载 model_xxxx 和 config.yml 即可
推理所需要的显卡要求应该特别低,不过最低配置是什么我没测试过
#进入项目文件夹
%cd /workspace/workdir/DDSP-SVC
#将底模复制到模型目录下
#无底模训练可不执行这条(暂无底模)
#%cp pretrain/model_0.pt exp/reflow-test/
#划分验证集
!python draw.py
#预处理
!python preprocess.py -c configs/reflow.yaml
# 主模型训练
# 目前镜像默认单个说话人的训练,多说话人请查看仓库的数据集放置格式
%cd /workspace/workdir/DDSP-SVC
!python train_reflow.py -c configs/reflow.yaml
目前支持批量推理
将你的音频放入DDSP-SVC/raw文件夹中 推理结果位于DDSP-SVC/results文件夹中
模型文件和配置文件位于DDSP-SVC/exp/reflow-test文件夹中
默认为模型名称为model_10000.pt
请将其修改为你自己想要推理的模型名称
更多推理参数请自行查看仓库
https://github.com/yxlllc/DDSP-SVC/blob/6.2/cn_README.md
将下面的model_name改为你自己想推理的模型
%cd /workspace/workdir/DDSP-SVC
#修改这个model_name为你想推理的模型参数👇
model_name = 'model_4000.pt'
#这个是采样器👇 "euler" "rk4"
method = 'euler'
!python infers.py -m {model_name} -method {method}
#启动tensorboard
#模型训练靠机器,效果如何自己听 tensorboard并不是万能的,不能过于相信上面的参数
!ps -ef | grep tensorboard | awk '{print $2}' | xargs kill -9
!tensorboard --port 6006 --logdir /workspace/workdir/DDSP-SVC/exp/reflow-test/logs
打包后的模型在autodl-tmp/workdir文件夹中
#打包模型到workdir文件夹
!zip -r /workspace/workdir/DDSP6.2模型及配置文件.zip /workspace/workdir/DDSP-SVC/exp/reflow-test/