百度ERNIE-Image的Lora训练AI-TOOLKIT一键部署

控制台

立即注册

百度ERNIE-Image的Lora训练AI-TOOLKIT

0元/小时

v2.0

v1.0

环境准备

推荐显卡：RTX 4090 或 RTX 3090（至少 24G 显存）

第一步：打标（数据集标注）

打标有以下两种方式：

**方式一：LoRA Caption（推荐）**https://huggingface.co/spaces/comfyuiman/loracaptionertaz

输入你的 Gemini API Key
上传图片或压缩包，即可自动批量打标

方式二：官方网站界面

无 Gemini API Key 时可使用，适合初学者

打标注意事项

训练类型	打标方式

| 角色 LoRA | 不打标角色特征（发色、眼色、服饰等），只写触发词 + 简单描述 |

| 风格 LoRA | 全部打标，但不写"二次元"等风格词，只描述人物（如"年轻男孩"） |

第二步：部署云端实例

点击「部署实例」，选择 RTX 4090 / 3090
打开 JupyterLab
将启动命令复制粘贴到终端，按回车运行 cd /workspace/ai-toolkit/ui

npm run build_and_start

bash /workspace/ai-toolkit/fix_env.sh

启动完成后，打开 AI Toolkit

第三步：新建训练任务

在 AI Toolkit 中点击 New Job
选择百度 Ernie 模型，或从「Queue」中加载现有模板
克隆模板后，按需修改以下参数：

关键参数说明

参数	说明	推荐值
触发词	若打标时未设置，需在此手动填写	自定义

| Low VRAM + FP8 | 显存不足时必须开启，否则会跳过批次影响效果 | ✅ 开启 |

| 分辨率 | 默认 768×1024，可选 1280 | 按需选择 |

| Learning Rate | 学习率 | 默认即可，无需修改 |

| LoRA Rank | 低秩维度 | 64 或 128，可自行测试 |

| Timestep | 采样调度 | 默认 Wei；角色可试 Sigmoid（随机性较强） |

第四步：上传数据集并开始训练

在 AI Toolkit 中新建 Dataset，输入名称
上传已打标的图片文件夹（建议直接上传文件夹，速度更快）
在采样设置中填入触发词 + 提示词，设置采样间隔步数
确认配置后点击 Create Job，开始训练

💡 整个 LoRA 训练大约需要 3~4 小时，训练过程中可通过采样预览图查看效果变化，选取最满意的Lora使用

其他说明

unload text encoder / cache text encoder outputs 等高级选项一般无需开启，默认配置即可满足大多数需求
如需微调效果，可在训练完成后再探索高级参数

@梦影Erislia

镜像信息

已使用14 次

运行时长

207 H

镜像大小

190GB

最后更新时间

2026-04-15

支持卡型

RTX40系RTX50系48G RTX40系A800H20V100SA1003090

框架版本

PyTorch-2.9

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v2.0

2026-04-15

PyTorch:2.9 | CUDA:12.8 | 大小:190.00GB

v1.0

2026-04-15

PyTorch:2.9 | CUDA:12.8 | 大小:190.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分