优云智算
控制台
立即注册
Krea2的Lora训练
Krea2的Lora训练
star1
0/小时
v1.0
最新

Krea 2 LoRA 训练 — AI Toolkit(云端)

使用 AI Toolkit 在云端基于 Krea 2 Raw(原生)模型训练 LoRA。

为什么用 Raw 而不是 Turbo

  • Turbo 是蒸馏后的模型,推理速度快,但不适合用来训练 LoRA
  • 官方推荐在 Raw 模型上训练,微调/后处理效果更好
  • 在 Raw 上训练完的 LoRA,同样可以直接用在 Turbo 上
  • 如果一定要在 Turbo 上训练,AI Toolkit 也支持,需要使用专门的 Adapter(效果不如 Raw)

环境要求

  • GPU:推荐 4090(显存占用较高,预设配置就是按 4090 调的,刚好够用)
  • 3090 可用,但需要手动调整设置(offloading 调高),否则会爆显存
  • ⚠️ 部署时建议开启网络加速,避免联网相关的报错

快速开始

# 1. 部署 GPU 实例(建议开启网络加速选项)
# 2. 打开 Jupyter Lab,复制启动指令粘贴运行
# 3. 等待启动完成

训练流程

1. 准备数据集

  • dataset 目录下新建文件夹(直接在文件管理器里新建会比在 AI Toolkit 内新建更快)
  • 把图片(及已有的打标 txt)一起拖进去

2. 打标

进入 AI Toolkit 界面后:

  • 选择 Data Source,关联刚建好的文件夹(也可以在界面内直接 New Data Source)
  • 没有打标的图片,使用 Auto Caption
    • 模型选择 千问3 VL(Qwen3-VL)4B
    • Resolution 和 Tokens 都设为 1024

打标 Prompt 设置(按 LoRA 类型区分):

LoRA 类型打标方式
角色 LoRA不要描述角色特征(发色、瞳色等)
风格 LoRA(如二次元)正常详细打标,不要特意说明"这是二次元"

点击 Add to Queue 开始打标。

3. 创建训练任务

  • 数据集打标完成后,点击 New Job,或直接克隆已有预设修改
  • 训练基于 Krea 2 Raw 模型(不是 Turbo)

关键参数:

参数推荐值说明
Offloading4090: 默认即可;3090 / 爆显存: 调到 50 左右显存不够就调高
分辨率768×1024(默认)爆显存可调低
Transformer 精度默认;仍报错可改为 6bit一般不需要改,主要调 Text Encoder
LoRA Rank默认 32(足够用),可改 16
训练步数10000 步看到效果满意即可直接下载,无需等满
学习率默认 0.01保持默认即可
Repeat 数按数据集大小调整:30~40 张图可设 4;图多则调低(如 2)
采样提示词按训练内容自定义(如二次元用二次元风格提示词)
采样分辨率默认 1024×1024

⚠️ 务必确认部署时已开启网络加速,否则训练任务可能因为联网下载 Adapter 等组件而报错

设置完成后点击 Update,再点击启动即可开始训练。

训练参考数据

  • 速度参考:约 3.46 it/s(4090)
  • 训练 1300 步约耗时 2 小时
  • 角色特征通常在训练过程中逐步显现

显存不足(OOM)应对

  1. 提高 Offloading(如调到 50)
  2. 降低分辨率
  3. Transformer 改用更低精度(如 6bit)

角色 LoRA 训练建议尽量使用 4090 及以上显卡;3090 务必调高 offloading,否则容易直接爆显存

小结

  • 始终在 Raw 模型上训练 LoRA,Turbo 上直接复用即可
  • 角色 LoRA 打标时排除外观特征描述;风格 LoRA 正常详细打标
  • 训练步数给够(建议 1 万步),中途看效果满意可随时下载,避免后续用 Resume 恢复训练的麻烦
@梦影Erislia
镜像信息
已使用0
运行时长
0 H
镜像大小
170GB
最后更新时间
2026-06-27
支持卡型
RTX40系RTX50系48G RTX40系3090A800H20A100
+7
框架版本
PyTorch-2.9
CUDA版本
12.8.
应用
JupyterLab: 8888
版本
v1.0
2026-06-27
PyTorch:2.9 | CUDA:12.8. | 大小:170.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台