ACE-Step 1.5 LoRA 训练教程

📌 简介

ACE-Step 1.5 是目前本地端最强大的音乐生成模型之一，质量接近 Suno v4.5-5之间。通过 LoRA 训练，可以控制特定的音乐风格和音色。

🖥️ 硬件要求

显卡：RTX 3090 或 4090（至少 24GB 显存）
云端训练同样可行（速度非常快，约 10 分钟完成）

🎵 素材准备

建议使用网易云等平台下载的音频文件
不推荐直接使用 B 站下载的音频（存在转码问题，文件名含特殊符号也会报错）
B 站音频如需使用，需先运行以下脚本进行预处理：

./clean_audio.sh

处理完成后再将音频导入 music 文件夹即可正常使用。

🚀 训练流程

将音乐素材放入 music 文件夹
启动 ComfyUI，加载 LoRA 训练工作流
设置触发词（如歌手名）
选择模型：0.6B / 1.7B / 4B（默认推荐 1.7B）
对素材进行预处理（约 2~3 分钟）
开始训练

🔧 训练参数建议

参数	推荐值
LoRA Rank	64
Learning Rate	0.003
训练步数（Epochs）	500（官方推荐，效果已足够）

默认参数直接使用即可，无需大幅调整。

🎼 生成歌曲

训练完成后，将 LoRA 文件放入 ComfyUI 对应目录并刷新即可使用。

在 UI 中输入歌词和风格提示词即可生成歌曲
风格提示词建议使用 AI 辅助生成，效果更佳
默认生成时长为 120 秒，可自行修改
Remix / 参考音频功能仅支持在 ACE-Step UI 中使用，ComfyUI 暂不支持

📚 进阶学习

如需了解更多参数细节，可参考：

ComfyUI 节点内的参数说明 https://github.com/filliptm/ComfyUI-FL-AceStep-Training
ACE-Step 官方 LoRA 训练指南 https://github.com/ace-step/ACE-Step-1.5

@梦影Erislia

镜像信息

已使用11 次

运行时长

18 H

镜像大小

170GB

最后更新时间

2026-02-19

支持卡型

RTX40系RTX50系48G RTX40系30903080TiA800H20V100SA100

框架版本

PyTorch-2.9

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.0

2026-02-19

PyTorch:2.9 | CUDA:12.8 | 大小:170.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得|PICPIK.AI|LangChain中文网

产品

GPU实例 GPU镜像社区模型API服务

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分