控制台
立即注册
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
star0
0/小时
v1.0
最新

🖥️ 环境要求

  • 推荐显卡:RTX 48 系(48G 显存)
  • ⚠️ 24G 显存(如 4090)在视频训练时大概率爆显存,不推荐


🚀 快速开始

1. 启动服务

连接云端实例后,运行启动指令启动 AI Toolkit。

2. 准备数据集

在云端新建一个文件夹,将训练素材(图片或视频)上传进去。

建议直接在云端新建文件夹上传,速度会比在 AI Toolkit 内上传更快。

3. 打标(Captioning)

根据需求选择打标工具:

工具适用场景
Gemini(推荐)正规视频,支持音频描述
AAS Studio可批量打标,支持自定义角色命名,需导入 API
Joy Caption Beta 1适合 NSFW 内容,无内容限制
千问支持 NSFW,需本地部署模型

打标注意事项:

  • 训练 LoRA 角色时,不要在标注中描述该角色的外貌特征(如发色、眼睛颜色等)
  • 视频有音频时,必须在标注中描述音频内容,否则音频训练效果会很差

⚙️ 训练参数设置

在 AI Toolkit 中按以下步骤配置:

① 选择数据集 选择已上传素材的文件夹。

② 触发词 填入打标中使用的触发词(可选)。

③ 帧数设置

  • 图片训练:number_frames = 1,关闭音频选项
  • 视频训练:建议设置 33 帧(或多组如 33 + 17,遵循 8n+1 规则)

④ Repeat 数 根据素材数量调整。约 30 张图建议设置 5~6,使总次数接近 200,保证训练步数充足。

⑤ 分辨率

  • 推荐:1024(LTX 2.3 原生支持 720P / 1080P)
  • 长视频建议适当降低,避免内存溢出

⑥ 显存优化 使用 48G 显卡时,可关闭低显存模式。

⑦ 采样设置(Sample)

  • 修改为自己的分辨率(如 720×1280
  • 500 步采样一次(每 250 步保存一个 LoRA 的情况下,适当拉大采样间隔节省时间)
  • 可自定义采样提示词

⑧ 其他选项

  • catch_textdo_video_audio:视频含音频时打开
  • Differential Training:LoRA 过拟合时可尝试开启,一般不需要
  • sigmoid scheduler:效果有随机性,可根据需要选用

▶️ 开始训练

参数配置完成后,点击 更新 保存设置,再点击 ▶ 三角形按钮 开始训练,界面会自动重新加载并启动。

@梦影Erislia
镜像信息
已使用0
运行时长
0 H
镜像大小
170GB
最后更新时间
2026-03-24
支持卡型
48G RTX40系RTX50系A800V100SA100H20
+6
框架版本
PyTorch-2.9
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-03-24
PyTorch:2.9 | CUDA:12.8 | 大小:170.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台