控制台

立即注册

LTX2.3Lora训练用AI-toolkit，简单配置一键训练

0元/小时

v1.0

LTX2.3Lora训练用AI-toolkit，简单配置一键训练

镜像简介

本镜像集成AI-toolkit工具包，专为LTX 2.3视频生成模型提供一键式LoRA训练环境。通过简单配置即可快速启动个性化训练流程，支持风格迁移、角色一致性等定制化微调，显著降低模型训练门槛。适用于短视频创作、广告内容生成及动态视觉设计等场景，提供高效的一站式视频模型训练解决方案。

🖥️ 环境要求

推荐显卡：RTX 48 系（48G 显存）
⚠️ 24G 显存（如 4090）在视频训练时大概率爆显存，不推荐

🚀 快速开始

1. 启动服务

连接云端实例后，运行启动指令启动 AI Toolkit。

2. 准备数据集

在云端新建一个文件夹，将训练素材（图片或视频）上传进去。

建议直接在云端新建文件夹上传，速度会比在 AI Toolkit 内上传更快。

3. 打标（Captioning）

根据需求选择打标工具：

工具	适用场景
Gemini（推荐）	正规视频，支持音频描述
AAS Studio	可批量打标，支持自定义角色命名，需导入 API
Joy Caption Beta 1	适合 NSFW 内容，无内容限制
千问	支持 NSFW，需本地部署模型

打标注意事项：

训练 LoRA 角色时，不要在标注中描述该角色的外貌特征（如发色、眼睛颜色等）
视频有音频时，必须在标注中描述音频内容，否则音频训练效果会很差

⚙️ 训练参数设置

在 AI Toolkit 中按以下步骤配置：

① 选择数据集 选择已上传素材的文件夹。

② 触发词 填入打标中使用的触发词（可选）。

③ 帧数设置

图片训练：number_frames = 1，关闭音频选项
视频训练：建议设置 33 帧（或多组如 33 + 17，遵循 8n+1 规则）

④ Repeat 数 根据素材数量调整。约 30 张图建议设置 5~6，使总次数接近 200，保证训练步数充足。

⑤ 分辨率

推荐：1024（LTX 2.3 原生支持 720P / 1080P）
长视频建议适当降低，避免内存溢出

⑥ 显存优化 使用 48G 显卡时，可关闭低显存模式。

⑦ 采样设置（Sample）

修改为自己的分辨率（如 720×1280）
每 500 步采样一次（每 250 步保存一个 LoRA 的情况下，适当拉大采样间隔节省时间）
可自定义采样提示词

⑧ 其他选项

catch_text 和 do_video_audio：视频含音频时打开
Differential Training：LoRA 过拟合时可尝试开启，一般不需要
sigmoid scheduler：效果有随机性，可根据需要选用

▶️ 开始训练

参数配置完成后，点击更新保存设置，再点击 ▶ 三角形按钮 开始训练，界面会自动重新加载并启动。

@梦影Erislia

镜像信息

已使用144 次

运行时长

2068 H

镜像大小

170GB

最后更新时间

2026-03-25

支持卡型

48G RTX40系RTX50系A800V100SA100H20

框架版本

PyTorch-2.9

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.0

2026-03-25

PyTorch:2.9 | CUDA:12.8 | 大小:170.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分