FlyMy.AI 开源了针对 Qwen-Image 模型的 LoRA训练工具,为开发者提供一个轻量、高效、可扩展的多模态模型微调工具。
该项目旨在降低图像生成模型定制化的门槛,支持用户基于自有数据集快速训练个性化 LoRA 模型,适用于图像风格迁移、特定对象生成等场景。

什么是 Qwen-Image?
Qwen-Image 是通义千问系列中首个专注于图像生成的基础大模型。通过 LoRA 微调,可以在不重训整个模型的前提下,让其适应特定视觉风格或任务需求,显著降低计算成本。
FlyMy.AI 的这一开源项目,正是为了帮助开发者更便捷地完成这一过程。
项目特点
| 特性 | 说明 |
|---|---|
| 🔹 基于 LoRA 的高效微调 | 仅训练低秩矩阵,节省显存与算力,适合消费级 GPU |
| 🔹 兼容 Hugging Face Diffusers | 无缝集成主流生态,便于部署与扩展 |
| 🔹 YAML 配置驱动 | 所有训练参数通过配置文件定义,易于管理与复现 |
| 🔹 完全开源 | 代码、示例、权重全部公开,支持社区共建 |
⚠️ 项目状态:开发中,但已可用
当前项目处于积极完善阶段,核心功能已稳定运行,适合早期采用者和实验性项目使用。
开发进展
| 阶段 | 状态 |
|---|---|
| 基础代码实现 | ✅ 已完成 |
| LoRA 训练功能 | ✅ 已实现 |
| 性能优化 | 🔄 进行中 |
| 测试覆盖与文档完善 | 🔜 即将推出 |
📌 建议用于研究、原型开发或小规模生产;大规模部署前建议自行验证稳定性。
📦 快速安装与环境准备
1. 克隆项目仓库
git clone https://github.com/FlyMyAI/qwen-image-lora-trainer
cd qwen-image-lora-trainer
2. 安装依赖
pip install -r requirements.txt
3. 安装最新版 Diffusers(GitHub 主干)
pip install git+https://github.com/huggingface/diffusers
⚠️ 注意:需使用最新版本
diffusers以确保兼容 Qwen-Image 架构。
💾 可选:下载预训练 LoRA 权重
FlyMy.AI 提供了一个示例 LoRA 模型 —— flymy_realism.safetensors,用于增强图像写实风格。
方法一:克隆完整权重仓库
git clone https://huggingface.co/flymy-ai/qwen-image-realism-lora
方法二:单独下载权重文件
wget https://huggingface.co/flymy-ai/qwen-image-realism-lora/resolve/main/flymy_realism.safetensors
该权重可用于迁移学习起点,或作为推理时的风格插件。
🏁 开始训练:一键启动
使用配置文件启动训练任务:
accelerate launch train.py --config ./train_configs/train_lora.yaml
配置文件说明(train_lora.yaml)
请确保以下关键字段已正确设置:
model_name_or_path: "Qwen/Qwen-Image" # 基座模型路径
dataset_path: "./data/my_images" # 本地数据集目录
output_dir: "./output/lora_weights" # 权重输出路径
resolution: 512 # 图像分辨率
train_batch_size: 4
gradient_accumulation_steps: 4
learning_rate: 1e-4
max_train_steps: 5000
lora_rank: 32 # LoRA 秩
lora_alpha: 64
lora_dropout: 0.05
支持从 Hugging Face Dataset 或本地文件夹加载图像-文本对数据。
使用建议与适用场景
✅ 推荐使用场景
- 图像风格定制(如写实风、动漫风、极简风)
- 特定对象生成(如品牌产品、人物形象)
- 多模态代理系统中的个性化视觉输出模块
🛠️ 硬件建议
- 显存 ≥ 16GB(如 RTX 3090 / 4090)
- 使用
accelerate支持多卡训练(可选) - 推荐启用混合精度(FP16)以提升效率
关于 FlyMy.AI
FlyMy.AI 是一家专注于生成式 AI 代理基础设施的 B2B 技术公司。其目标是为企业和开发者提供构建、运行和管理生成式 AI 媒体代理的底层平台,涵盖文本、图像、视频等多模态内容的自动化生成与调度。















