3使用前,请先将你的原始长音频替换到 /workspace/datasets/raw_media/speaker1.wav,并保持文件名 speaker1.wav 不变。
执行以下命令:
bash /mnt/data/run_voxcpm_prepare_only.sh
即可自动完成一键切片、中文 ASR 自动打标以及训练清单生成。
全部处理结束后,点击 SD-WebUI 进入训练界面,即可开始后续训练与生成。
相关文档:https://pan.quark.cn/s/cee8509df856
教学视频:
认证作者

支持自启动