阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

阿里通义实验室 Qwen 项目组正式发布 Qwen-Image-Edit-2511,这是继 9 月发布的 Qwen-Image-Edit-2509 后的增强版本。从版本号“2511”可见,该模型原计划于 11 月推出。用户可通过 Qwen Chat 的图像编辑功能直接体验。

作为一款面向开源社区的多模态图像编辑模型,Qwen-Image-Edit-2511 在生成一致性、几何推理、工业设计支持等方面实现多项关键改进,并首次内置社区 LoRA 模型能力,大幅降低高级编辑的使用门槛。

阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

主要增强特性

1. 显著提升人物一致性

新版本在保留主体身份特征与视觉风格的前提下,支持更具想象力的编辑操作。无论是更换背景、添加配饰,还是调整姿态,生成结果都能更忠实于原始人像。

阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

多人场景一致性突破

在 Qwen-Image-Edit-2509 已优化单人一致性的基础上,2511 版本进一步解决了多人合影编辑的难题:

  • 可将两张独立人像高保真融合为一张协调的群像照片
  • 保持各人物的面部特征、肤色、光照方向一致
  • 避免多人编辑中常见的“身份漂移”或“风格割裂”问题

这一能力对家庭合影增强、虚拟合照等场景具有直接应用价值。

阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

2. 内置支持社区 LoRA 模型

自 Qwen-Image-Edit 开源以来,社区开发者贡献了大量高质量 LoRA 微调模型,涵盖光照控制、视角变换、艺术风格迁移等方向。

阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

Qwen-Image-Edit-2511 将部分精选 LoRA 直接集成到基础模型中,用户无需手动加载或配置,即可“开箱即用”以下能力:

  • 光照增强 LoRA:实现更逼真的光影控制,例如模拟黄昏、舞台光或自然窗光
  • 新视角生成:基于单张正面照,生成侧脸、俯视或仰视等新视角图像

这一集成大幅简化了工作流,使普通用户也能轻松调用社区创新成果。

阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

3. 强化工业设计生成能力

团队特别优化了模型在工程与产品设计场景中的表现:

  • 批量工业产品生成:支持快速生成同一品类的多款设计变体(如不同造型的水杯、耳机、灯具)
  • 材质替换:可在保留结构的前提下,将塑料部件替换为金属、木材或织物材质
  • 设计一致性保持:确保系列化产品在比例、接口、风格上协调统一

这些改进使 Qwen-Image-Edit-2511 更适用于概念设计、原型可视化等专业场景。

阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

4. 增强几何推理能力

新版本引入更强的空间与几何理解能力,典型应用包括:

  • 自动生成辅助构造线:在工业设计或技术绘图中,可为物体自动添加中心线、对称轴、投影参考线等
  • 精准结构保持:在编辑过程中维持物体的透视关系、比例和连接逻辑,避免变形失真

这一能力对需要精确标注或工程草图生成的用户尤为实用。

阿里通义实验室发布Qwen-Image-Edit-2511:显著提升人物一致性与工业设计能力,支持 LoRA 集成与多图融合

部署与使用

  • 在线体验:访问 Qwen Chat,选择“图像编辑”功能即可使用最新模型。
  • 本地部署
    • ComfyUI已第一时间完成适配
    • 模型体积为 40.9 GB,对显存要求较高,建议使用 24GB+ 显存显卡(如 RTX 4090、5090)
    • 大家可以等待开源社区推出 GGUF、量化版等优化版本,以降低硬件门槛。
© 版权声明

相关文章

暂无评论

none
暂无评论...