1本镜像是专为腾讯混元视频模型打造的LoRA一站式训练环境,基于ComfyUI可视化界面,集成了数据标注、模型训练与流程测试的全套工具。用户可通过简洁操作对视频生成效果进行个性化微调,实现风格迁移与角色一致性定制。适用于广告制作、短视频创作及动画设计等场景,大幅降低视频模型定制化门槛,支持高效、低成本的AI视频生成训练。










该lora适用于腾讯混元视频模型,可以训练 人物,镜头,动作等 lora,用于对视频输出内容进行一个固定
使用项目joycaption进行训练集的自然语言标注
项目地址https://github.com/tdrussell/diffusion-pipe
使用项目diffusion-pipe进行训练
项目地址:https://github.com/fpgaminer/joycaption
对于数据集
1.推荐使用自然语言进行标注,镜像内的标注目前测试过效果还可以,比我人肉标好,当然也需要部分修改
2.标注文件的文件名称,和图片名称应一致,下面是数据集的放置格式
3.图片设置了分桶,自适应分辨率,所以图片大点没关系
4.镜像自带的标注目前支持jpg和png,不区分大小写,其他格式你自己改一下脚本也能用
5.对于一些rsq或者ysq,自动标注也能正常标
hunyuan_video_vae_bf16.safetensors和hunyuan_video_720_cfgdistill_fp8_e4m3fn.safetensors
workdir/diffusion-pipe/examples中,修改之前记得备份,看不懂的别动,默认就行,有更好的参数可以发我
workdir/ComfyUI/models/loras,右键复制粘贴过去即可
认证作者