1本指南介绍如何使用 Jupyter 环境进行 Qwen Image 模型的 LoRA 训练流程。
打开 Jupyter 后,按以下步骤操作:
进入数据集目录:
datasets/image/
上传准备好的训练数据:
.txt 标注文件根据需要调整训练参数:
编辑 dataset.toml 文件,调整图片分辨率相关配置
编辑 qwen.toml 文件,调整模型训练的高级参数
在 Jupyter 界面的终端中执行以下命令:
进入工作目录:
cd /workspace/diffusion-pipe
启动训练:
NCCL_P2P_DISABLE="1" NCCL_IB_DISABLE="1" deepspeed --num_gpus=1 train.py --deepspeed --config examples/qwen_image_24gb_vram.toml

训练开始一段时间后,可以通过 TensorBoard 监控 loss 变化:
在终端中执行:
tensorboard --logdir /workspace/diffusion-pipe/logs/lora_current/ --port 6006 --host 0.0.0.0
点击 Jupyter 界面旁边的 TensorBoard 标签查看可视化结果
在终端中执行指令恢复中断的训练:
cd /workspace/diffusion-pipe
deepspeed --num_gpus=1 train.py \
--deepspeed \
--config examples/qwen_image_24gb_vram.toml \
--resume_from_checkpoint "20251130_18-57-11"
如遇到显存不足,可以尝试:
dataset.toml 中的分辨率设置qwen.toml 中的 batch size 参数![11月30日 - frame at 1m36s (1).jpg]