0⚠️ 24G 显存(如 4090)在视频训练时大概率爆显存,不推荐
连接云端实例后,运行启动指令启动 AI Toolkit。
在云端新建一个文件夹,将训练素材(图片或视频)上传进去。
建议直接在云端新建文件夹上传,速度会比在 AI Toolkit 内上传更快。
根据需求选择打标工具:
| 工具 | 适用场景 |
|---|---|
| Gemini(推荐) | 正规视频,支持音频描述 |
| AAS Studio | 可批量打标,支持自定义角色命名,需导入 API |
| Joy Caption Beta 1 | 适合 NSFW 内容,无内容限制 |
| 千问 | 支持 NSFW,需本地部署模型 |
打标注意事项:
在 AI Toolkit 中按以下步骤配置:
① 选择数据集 选择已上传素材的文件夹。
② 触发词 填入打标中使用的触发词(可选)。
③ 帧数设置
number_frames = 1,关闭音频选项33 帧(或多组如 33 + 17,遵循 8n+1 规则)④ Repeat 数
根据素材数量调整。约 30 张图建议设置 5~6,使总次数接近 200,保证训练步数充足。
⑤ 分辨率
1024(LTX 2.3 原生支持 720P / 1080P)⑥ 显存优化 使用 48G 显卡时,可关闭低显存模式。
⑦ 采样设置(Sample)
720×1280)500 步采样一次(每 250 步保存一个 LoRA 的情况下,适当拉大采样间隔节省时间)⑧ 其他选项
catch_text 和 do_video_audio:视频含音频时打开Differential Training:LoRA 过拟合时可尝试开启,一般不需要sigmoid scheduler:效果有随机性,可根据需要选用参数配置完成后,点击 更新 保存设置,再点击 ▶ 三角形按钮 开始训练,界面会自动重新加载并启动。
