控制台
立即注册
LTX2.3Lora训练支持Musubi-tuner
LTX2.3Lora训练支持Musubi-tuner
star1
0/小时
v1.0
最新

☁️ 云端训练 LTX-Video 2.3 LoRA 教程

本教程基于 Musubi tune(fork 版仓库),目前是唯一支持 LTX-Video 2.3 的训练方案,已帮大家在云端配置好环境,开箱即用。https://github.com/AkaneTendo25/musubi-tuner/blob/ltx-2/docs/ltx_2.md


📋 环境要求

项目要求
显存最低 24G(4090),推荐 48G 或 50 系
训练模式仅视频 / 仅图片 / 视频+图片 均支持
音频支持av 模式可同时训练音频

⚠️ 低于 24G 显存将无法训练,该模型对显存要求较高。


🏷️ 第一步:打标(数据标注)

推荐使用视频作者提供的配套打标工具https://huggingface.co/spaces/comfyuiman/loracaptionertaz

  1. 上传你的图片文件夹(压缩包格式)
  2. 工具将自动批量打标,输出 图片 + TXT 标注文件
  3. 下载后解压,即为 LoRA 训练所需的 dataset 格式

关于 API 选择:

  • 默认使用 Gemini API
  • 也可替换为千问等本地模型

☁️ 第二步:云端启动

  1. 打开云端环境,推荐选择 24G 4090 或更高配置
  2. 进入 dataset 面板,上传你的素材(支持图片和视频)
  3. 根据素材类型,修改 dataset 配置文件中的对应段落:
    • 图片 + 视频:取消注释图片和视频两段
    • 仅图片:注释掉视频段,保留图片段
    • 仅视频:反之操作
  4. Ctrl+S 保存配置

▶️ 第三步:启动训练

复制启动指令并运行,选择训练模式:

模式适用场景
video仅视频 / 仅图片
av视频 + 音频(推荐有声视频使用此模式)

训练共分三个阶段:

  1. Latent Cache:缓存图片潜变量
  2. Text Encoder Cache:缓存文本编码器
  3. 正式训练:开始迭代训练

参数说明
分辨率可自定义,如 12801280×720
repeat根据数据量调整,约 40 图/视频时,repeat=6 使总步数达 200 左右
modevideoav,有音频建议用 av

训练配置(Configure)

参数推荐值 / 说明
vae_slicing报显存错误(OOM)时开启,24G 显卡建议开启,值可设为 20
优化器推荐 AdamW(稳定)或 8bit Adam(省显存),不推荐 Prodigy(不稳定)
学习率图片训练:1e-41e-5;视频训练:5e-5(拟合更慢,效果更好)
LoRA rank/dim推荐 64/3264/64,数值越大 LoRA 能力越强
max_train_steps建议设高一些,自行在曲线中找最佳 checkpoint
保存间隔默认每 250 步保存一次
优化器(显示器)默认 AdaFactor,也可用 AdamW

📊 第四步:监控训练曲线(TensorBoard)

在新终端中运行 TensorBoard 命令,打开后可查看:

  • loss_epoch:总体损失曲线
  • loss_video:视频损失曲线(主要参考此曲线)
  • loss_audio:音频损失曲线(av 模式下会有,波动较大属正常)

💡 重点关注 loss_video 曲线,音频曲线波动大是正常现象。


📁 第五步:获取训练好的 LoRA

训练完成后,LoRA 文件保存在 outputs/ 文件夹中。

请下载后缀为 comfy.safetensors(COMFY 格式)的文件,才能在 ComfyUI 等工具中使用。


💡 经验分享

  • 角色 LoRA:训练约 2000 步效果最佳,超过 3000~4000 步后动作多样性会下降
  • 风格 LoRA:原理相同,需自备对应风格素材
  • 新手建议:直接扔入 dataset,无需改参数,默认配置即可出效果
  • 进阶调参:参考仓库官方文档(DOCS),内有详细说明

🔗 相关资源


🎉 快速开始

1. 实名注册云端平台(新用户可领 10 元体验金)
2. 选择 24G 4090 及以上实例
3. 上传 dataset → 修改配置 → 复制启动指令 → 开始训练
@梦影Erislia
镜像信息
已使用28
运行时长
71 H
镜像大小
220GB
最后更新时间
2026-03-18
支持卡型
RTX40系48G RTX40系RTX50系A100A800H20V100S
+7
框架版本
PyTorch-2.9
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-03-18
PyTorch:2.9 | CUDA:12.8 | 大小:220.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台