小红书智能创作基础技术团队正式推出 FireRed-Image-Edit-1.1。作为前代通用图像编辑模型的升级版,1.1 版本在保留强大编辑能力的基础上,重点攻克了身份一致性、多图像复杂控制及领域专业性能三大难题,旨在将开源模型的创意生产力推向全新高度。
- 模型:https://huggingface.co/FireRedTeam/FireRed-Image-Edit-1.1
- ComfyUI:https://huggingface.co/FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- Lora:https://huggingface.co/FireRedTeam/FireRed-Image-Edit-LoRA-Zoo

核心亮点:从“能用”到“好用”的质变
1. 强大的编辑性能:媲美商业级效果
- 身份一致性 SOTA:在开源模型中首次实现角色身份完美保留。即使进行复杂的换装、换背景或风格化编辑,主体人物依然清晰可辨,彻底解决“换脸”痛点。
- 多元素智能融合:突破单图限制,支持自由组合 10+ 个元素。内置智能体(Agent)驱动的自动裁剪与拼接算法,用户无需编写冗长复杂的提示词,即可轻松完成海报合成、场景搭建等任务。
- 全场景人像精修:
- 专业美容:涵盖数十种妆容风格,从日常提亮(针对黄/橄榄肤色优化)到创意特效(如万圣节巫婆妆)。
- 老照片修复:具备卓越的细节恢复能力,一键还原破损老照片的质感与色彩。
- 高保真文本渲染:在图像中生成风格化文字时,排版精度与字体还原度直接对标闭源商业解决方案。

2. 终极工程优化:速度与灵活性的双重飞跃
- 极速生成:通过蒸馏、量化和静态编译的全套加速方案,仅需 30GB 显存 即可实现 4.5 秒 的端到端生成速度,让实时编辑成为可能。
- 开放 LoRA 生态:完整发布自定义风格的 LoRA 训练代码。配合优化的采样器,用户可用最低成本训练专属风格模型,最大化 GPU 利用率。
- 智能体工作流 (Agent Workflow):自动处理多图像输入与复杂构图(如虚拟试穿),将繁琐的预处理步骤自动化,极大降低使用门槛。
- 无缝部署集成:
- ComfyUI 原生支持:提供专用节点,轻松嵌入现有工作流。
- GGUF 格式兼容:支持轻量级部署,便于在消费级硬件或边缘设备上运行。

评估结果:开源新标杆,超越闭源竞品
在权威的 Imgedit、Gedit 和 RedEdit 基准测试中,FireRed-Image-Edit 1.1 确立了开源模型的新最先进水平(SOTA)。
- 提示遵循能力:显著优于同类开源模型,能精准理解复杂指令。
- 视觉一致性:在特定维度(如身份保持、纹理细节)上,甚至超越了部分闭源商业模型。
- 人类评估:盲测结果显示,专业评审对其生成质量、自然度及创意符合度的评分均处于领先地位。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...









