控制台

立即注册

Krea2的Lora训练

0元/小时

v1.0

Krea 2 LoRA 训练 — AI Toolkit（云端）

使用 AI Toolkit 在云端基于 Krea 2 Raw（原生）模型训练 LoRA。

为什么用 Raw 而不是 Turbo

Turbo 是蒸馏后的模型，推理速度快，但不适合用来训练 LoRA
官方推荐在 Raw 模型上训练，微调/后处理效果更好
在 Raw 上训练完的 LoRA，同样可以直接用在 Turbo 上
如果一定要在 Turbo 上训练，AI Toolkit 也支持，需要使用专门的 Adapter（效果不如 Raw）

环境要求

GPU：推荐 4090（显存占用较高，预设配置就是按 4090 调的，刚好够用）
3090 可用，但需要手动调整设置（offloading 调高），否则会爆显存
⚠️ 部署时建议开启网络加速，避免联网相关的报错

快速开始

# 1. 部署 GPU 实例（建议开启网络加速选项）
# 2. 打开 Jupyter Lab，复制启动指令粘贴运行
# 3. 等待启动完成

训练流程

1. 准备数据集

在 dataset 目录下新建文件夹（直接在文件管理器里新建会比在 AI Toolkit 内新建更快）
把图片（及已有的打标 txt）一起拖进去

2. 打标

进入 AI Toolkit 界面后：

选择 Data Source，关联刚建好的文件夹（也可以在界面内直接 New Data Source）
没有打标的图片，使用 Auto Caption：
- 模型选择 千问3 VL（Qwen3-VL）4B
- Resolution 和 Tokens 都设为 1024

打标 Prompt 设置（按 LoRA 类型区分）：

LoRA 类型	打标方式
角色 LoRA	不要描述角色特征（发色、瞳色等）
风格 LoRA（如二次元）	正常详细打标，不要特意说明"这是二次元"

点击 Add to Queue 开始打标。

3. 创建训练任务

数据集打标完成后，点击 New Job，或直接克隆已有预设修改
训练基于 Krea 2 Raw 模型（不是 Turbo）

关键参数：

参数	推荐值	说明
Offloading	4090: 默认即可；3090 / 爆显存: 调到 50 左右	显存不够就调高
分辨率	768×1024（默认）	爆显存可调低
Transformer 精度	默认；仍报错可改为 6bit	一般不需要改，主要调 Text Encoder
LoRA Rank	默认 32（足够用），可改 16
训练步数	10000 步	看到效果满意即可直接下载，无需等满
学习率	默认 0.01	保持默认即可
Repeat 数	按数据集大小调整：30~40 张图可设 4；图多则调低（如 2）
采样提示词	按训练内容自定义（如二次元用二次元风格提示词）
采样分辨率	默认 1024×1024

⚠️ 务必确认部署时已开启网络加速，否则训练任务可能因为联网下载 Adapter 等组件而报错

设置完成后点击 Update，再点击启动即可开始训练。

训练参考数据

速度参考：约 3.46 it/s（4090）
训练 1300 步约耗时 2 小时
角色特征通常在训练过程中逐步显现

显存不足（OOM）应对

提高 Offloading（如调到 50）
降低分辨率
Transformer 改用更低精度（如 6bit）

角色 LoRA 训练建议尽量使用 4090 及以上显卡；3090 务必调高 offloading，否则容易直接爆显存

小结

始终在 Raw 模型上训练 LoRA，Turbo 上直接复用即可
角色 LoRA 打标时排除外观特征描述；风格 LoRA 正常详细打标
训练步数给够（建议 1 万步），中途看效果满意可随时下载，避免后续用 Resume 恢复训练的麻烦

@梦影Erislia

镜像信息

已使用0 次

运行时长

0 H

镜像大小

170GB

最后更新时间

2026-06-27

支持卡型

RTX40系RTX50系48G RTX40系3090A800H20A100

框架版本

PyTorch-2.9

CUDA版本

12.8.

应用

JupyterLab: 8888

版本

v1.0

2026-06-27

PyTorch:2.9 | CUDA:12.8. | 大小:170.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分