优云智算
控制台
立即注册
百度ERNIE-Image的Lora训练AI-TOOLKIT
百度ERNIE-Image的Lora训练AI-TOOLKIT
star0
0/小时
v1.0
最新

环境准备

  • 推荐显卡:RTX 4090 或 RTX 3090(至少 24G 显存)

第一步:打标(数据集标注)

打标有以下两种方式:

**方式一:LoRA Caption(推荐)**https://huggingface.co/spaces/comfyuiman/loracaptionertaz

  1. 输入你的 Gemini API Key
  2. 上传图片或压缩包,即可自动批量打标

方式二:官方网站界面

  • 无 Gemini API Key 时可使用,适合初学者

打标注意事项

训练类型打标方式

| 角色 LoRA | 不打标角色特征(发色、眼色、服饰等),只写触发词 + 简单描述 |

| 风格 LoRA | 全部打标,但不写"二次元"等风格词,只描述人物(如"年轻男孩") |


第二步:部署云端实例

  1. 点击「部署实例」,选择 RTX 4090 / 3090
  2. 打开 JupyterLab
  3. 将启动命令复制粘贴到终端,按回车运行
  4. 启动完成后,打开 AI Toolkit

第三步:新建训练任务

  1. 在 AI Toolkit 中点击 New Job
  2. 选择百度 Ernie 模型,或从「Queue」中加载现有模板
  3. 克隆模板后,按需修改以下参数:

关键参数说明

参数说明推荐值
触发词若打标时未设置,需在此手动填写自定义

| Low VRAM + FP8 | 显存不足时必须开启,否则会跳过批次影响效果 | ✅ 开启 |

| num_repeats | 图片重复次数 | 角色:5;风格(图少):34;风格(图多):1 | | Steps | 训练步数,速度约 3.3 it/s | 1万2万 |

| 分辨率 | 默认 768×1024,可选 1280 | 按需选择 |

| Learning Rate | 学习率 | 默认即可,无需修改 |

| LoRA Rank | 低秩维度 | 64 或 128,可自行测试 |

| Timestep | 采样调度 | 默认 Wei;角色可试 Sigmoid(随机性较强) |


第四步:上传数据集并开始训练

  1. 在 AI Toolkit 中新建 Dataset,输入名称
  2. 上传已打标的图片文件夹(建议直接上传文件夹,速度更快)
  3. 在采样设置中填入触发词 + 提示词,设置采样间隔步数
  4. 确认配置后点击 Create Job,开始训练

💡 整个 LoRA 训练大约需要 3~4 小时,训练过程中可通过采样预览图查看效果变化,选取最满意的Lora使用


其他说明

  • unload text encoder / cache text encoder outputs 等高级选项一般无需开启,默认配置即可满足大多数需求
  • 如需微调效果,可在训练完成后再探索高级参数
@梦影Erislia
镜像信息
已使用0
运行时长
0 H
镜像大小
190GB
最后更新时间
2026-04-15
支持卡型
RTX40系RTX50系48G RTX40系3090A800H20V100SA100
+8
框架版本
PyTorch-2.9
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-04-15
PyTorch:2.9 | CUDA:12.8 | 大小:190.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台