控制台

立即注册

LTX2.3Lora训练支持Musubi-tuner

0元/小时

v1.0

☁️ 云端训练 LTX-Video 2.3 LoRA 教程

本教程基于 Musubi tune（fork 版仓库），目前是唯一支持 LTX-Video 2.3 的训练方案，已帮大家在云端配置好环境，开箱即用。https://github.com/AkaneTendo25/musubi-tuner/blob/ltx-2/docs/ltx_2.md

📋 环境要求

项目	要求
显存	最低 24G（4090），推荐 48G 或 50 系
训练模式	仅视频 / 仅图片 / 视频+图片均支持
音频支持	选 `av` 模式可同时训练音频

⚠️ 低于 24G 显存将无法训练，该模型对显存要求较高。

🏷️ 第一步：打标（数据标注）

推荐使用视频作者提供的配套打标工具：https://huggingface.co/spaces/comfyuiman/loracaptionertaz

上传你的图片文件夹（压缩包格式）
工具将自动批量打标，输出 图片 + TXT 标注文件
下载后解压，即为 LoRA 训练所需的 dataset 格式

关于 API 选择：

默认使用 Gemini API
也可替换为千问等本地模型

☁️ 第二步：云端启动

打开云端环境，推荐选择 24G 4090 或更高配置
进入 dataset 面板，上传你的素材（支持图片和视频）
根据素材类型，修改 dataset 配置文件中的对应段落：
- 图片 + 视频：取消注释图片和视频两段
- 仅图片：注释掉视频段，保留图片段
- 仅视频：反之操作
按 Ctrl+S 保存配置

▶️ 第三步：启动训练

复制启动指令并运行，选择训练模式：

模式	适用场景
`video`	仅视频 / 仅图片
`av`	视频 + 音频（推荐有声视频使用此模式）

训练共分三个阶段：

Latent Cache：缓存图片潜变量
Text Encoder Cache：缓存文本编码器
正式训练：开始迭代训练

参数	说明
分辨率	可自定义，如 `1280` 或 `1280×720`
`repeat`	根据数据量调整，约 40 图/视频时，`repeat=6` 使总步数达 200 左右
`mode`	`video` 或 `av`，有音频建议用 `av`

训练配置（Configure）

参数	推荐值 / 说明
`vae_slicing`	报显存错误（OOM）时开启，24G 显卡建议开启，值可设为 `20`
优化器	推荐 `AdamW`（稳定）或 `8bit Adam`（省显存），不推荐 `Prodigy`（不稳定）
学习率	图片训练：`1e-4` 或 `1e-5`；视频训练：`5e-5`（拟合更慢，效果更好）
LoRA `rank/dim`	推荐 `64/32` 或 `64/64`，数值越大 LoRA 能力越强
`max_train_steps`	建议设高一些，自行在曲线中找最佳 checkpoint
保存间隔	默认每 250 步保存一次
优化器（显示器）	默认 `AdaFactor`，也可用 `AdamW`

📊 第四步：监控训练曲线（TensorBoard）

在新终端中运行 TensorBoard 命令，打开后可查看：

loss_epoch：总体损失曲线
loss_video：视频损失曲线（主要参考此曲线）
loss_audio：音频损失曲线（av 模式下会有，波动较大属正常）

💡 重点关注 loss_video 曲线，音频曲线波动大是正常现象。

📁 第五步：获取训练好的 LoRA

训练完成后，LoRA 文件保存在 outputs/ 文件夹中。

✅ 请下载后缀为 comfy.safetensors（COMFY 格式）的文件，才能在 ComfyUI 等工具中使用。

💡 经验分享

角色 LoRA：训练约 2000 步效果最佳，超过 3000~4000 步后动作多样性会下降
风格 LoRA：原理相同，需自备对应风格素材
新手建议：直接扔入 dataset，无需改参数，默认配置即可出效果
进阶调参：参考仓库官方文档（DOCS），内有详细说明

🔗 相关资源

项目仓库：musubi-tuner（LTX-Video 2.3 fork 版）https://github.com/AkaneTendo25/musubi-tuner/blob/ltx-2/docs/ltx_2.md
官方文档：项目 docs/ 目录下，包含 LTX-Video 2 完整训练说明
官方 configure 示例：可在仓库 training_data 目录下载，注意修改路径以适配云端环境

🎉 快速开始

1. 实名注册云端平台（新用户可领 10 元体验金）
2. 选择 24G 4090 及以上实例
3. 上传 dataset → 修改配置 → 复制启动指令 → 开始训练

@梦影Erislia

镜像信息

已使用62 次

运行时长

278 H

镜像大小

220GB

最后更新时间

2026-03-18

支持卡型

RTX40系48G RTX40系RTX50系A100A800H20V100S

框架版本

PyTorch-2.9

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.0

2026-03-18

PyTorch:2.9 | CUDA:12.8 | 大小:220.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分