阿里通义实验室 Qwen 项目组正式发布 Qwen-Image-Edit-2511,这是继 9 月发布的 Qwen-Image-Edit-2509 后的增强版本。从版本号“2511”可见,该模型原计划于 11 月推出。用户可通过 Qwen Chat 的图像编辑功能直接体验。
- Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit-2511
- 魔塔:https://modelscope.cn/models/Qwen/Qwen-Image-Edit-2511
- Demo:https://huggingface.co/spaces/Qwen/Qwen-Image-Edit-2511
- ComfyUI:https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI
- Qwen-Image-Edit-2511-Lightning:https://huggingface.co/lightx2v/Qwen-Image-Edit-2511-Lightning
- GGUF版:https://huggingface.co/unsloth/Qwen-Image-Edit-2511-GGUF
作为一款面向开源社区的多模态图像编辑模型,Qwen-Image-Edit-2511 在生成一致性、几何推理、工业设计支持等方面实现多项关键改进,并首次内置社区 LoRA 模型能力,大幅降低高级编辑的使用门槛。

主要增强特性
1. 显著提升人物一致性
新版本在保留主体身份特征与视觉风格的前提下,支持更具想象力的编辑操作。无论是更换背景、添加配饰,还是调整姿态,生成结果都能更忠实于原始人像。

多人场景一致性突破
在 Qwen-Image-Edit-2509 已优化单人一致性的基础上,2511 版本进一步解决了多人合影编辑的难题:
- 可将两张独立人像高保真融合为一张协调的群像照片
- 保持各人物的面部特征、肤色、光照方向一致
- 避免多人编辑中常见的“身份漂移”或“风格割裂”问题
这一能力对家庭合影增强、虚拟合照等场景具有直接应用价值。

2. 内置支持社区 LoRA 模型
自 Qwen-Image-Edit 开源以来,社区开发者贡献了大量高质量 LoRA 微调模型,涵盖光照控制、视角变换、艺术风格迁移等方向。

Qwen-Image-Edit-2511 将部分精选 LoRA 直接集成到基础模型中,用户无需手动加载或配置,即可“开箱即用”以下能力:
- 光照增强 LoRA:实现更逼真的光影控制,例如模拟黄昏、舞台光或自然窗光
- 新视角生成:基于单张正面照,生成侧脸、俯视或仰视等新视角图像
这一集成大幅简化了工作流,使普通用户也能轻松调用社区创新成果。

3. 强化工业设计生成能力
团队特别优化了模型在工程与产品设计场景中的表现:
- 批量工业产品生成:支持快速生成同一品类的多款设计变体(如不同造型的水杯、耳机、灯具)
- 材质替换:可在保留结构的前提下,将塑料部件替换为金属、木材或织物材质
- 设计一致性保持:确保系列化产品在比例、接口、风格上协调统一
这些改进使 Qwen-Image-Edit-2511 更适用于概念设计、原型可视化等专业场景。

4. 增强几何推理能力
新版本引入更强的空间与几何理解能力,典型应用包括:
- 自动生成辅助构造线:在工业设计或技术绘图中,可为物体自动添加中心线、对称轴、投影参考线等
- 精准结构保持:在编辑过程中维持物体的透视关系、比例和连接逻辑,避免变形失真
这一能力对需要精确标注或工程草图生成的用户尤为实用。

部署与使用
- 在线体验:访问 Qwen Chat,选择“图像编辑”功能即可使用最新模型。
- 本地部署:
- ComfyUI已第一时间完成适配
- 模型体积为 40.9 GB,对显存要求较高,建议使用 24GB+ 显存显卡(如 RTX 4090、5090)
- 大家可以等待开源社区推出 GGUF、量化版等优化版本,以降低硬件门槛。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















