使用前,请先将你的原始长音频替换到 /workspace/datasets/raw_media/speaker1.wav,并保持文件名 speaker1.wav 不变。
/workspace/datasets/raw_media/speaker1.wav
speaker1.wav
执行以下命令:
bash /mnt/data/run_voxcpm_prepare_only.sh
即可自动完成一键切片、中文 ASR 自动打标以及训练清单生成。
全部处理结束后,点击 SD-WebUI 进入训练界面,即可开始后续训练与生成。