OpenAI 正加速布局多模态赛道!继传闻中的 GPT-5.2 即将发布后,其新一代图像生成模型 Image-2 系列 也在 LM Arena、Design Arena 等评估平台曝光实测。两款内部代号为 Chestnut(栗子) 和 Huzzlenut(榛子) 的新模型,预计将正式命名为 Image-2(标准版)和 Image-2-mini(轻量版),作为 Image-1 的继任者,剑指谷歌Nano Banana 2 主导的图像生成市场。

此次发布并非孤立行动——业界普遍认为,Image-2 系列将与 GPT-5.2 同步推出,这是 OpenAI 应对谷歌 Gemini 3 竞争、拉响内部“红色代码”警戒后的关键反击动作。目前 ChatGPT 代码中已出现相关发布准备迹象,预测平台 Polymarket 显示,市场对 12 月中旬发布的预期持续走高。
核心升级:三大亮点解决前代痛点
根据早期测试者反馈和平台实测数据,Image-2 系列的升级方向精准且务实,彻底弥补了 Image-1 的核心短板:
- 告别“黄调滤镜”,色彩还原度飙升
Image-1 长期被诟病的“莫名黄色调”问题,在 Image-2 中得到彻底修复。新模型的色彩表现更接近真实场景,精准度大幅提升,从根源上解决了创作者后期调色的额外成本。 - 细节与保真度暴增,对标行业标杆
在纹理渲染、结构还原上,Image-2 系列实现跨越式提升,已无限接近谷歌 Nano Banana 2 设定的行业标准。尽管在部分细分场景中,Nano Banana 2 仍保持微弱领先,但 OpenAI 已成功缩小绝大部分技术差距。 - 融合复古与先进,风格更具创意性
新模型的视觉风格让人联想到早期 DALL-E 的艺术质感,同时叠加了最新渲染技术的写实优势——既保留了 AI 创作的独特创意性,又提升了商业应用所需的写实度,兼顾艺术创作与实用设计场景。 - 新增图生码能力,拓展实用边界
除了图像生成,测试者还发现 Image-2 具备“图像中撰写精准代码片段”的能力,这一功能将进一步拓展模型在开发者场景中的应用,实现“创意+技术”的双重赋能。

对标谷歌:Image-2 与 Nano Banana 2 实力对比
谷歌 Nano Banana 2 凭借 4K 图像生成、十秒级渲染速度,以及“数学推导板书生成”等跨界能力,一直占据图像生成领域的头部位置,甚至被称作“PS 终结者”。其在 LM Arena 榜单中以 1362 的 Elo 分数大幅领先 Image-1(1170 分),经历 500 万次盲测验证的优势显著。
而 Image-2 系列的出现,直接打破了这一格局:
- 优势领域:Image-2 在色彩准确性、图像结构合理性上实现反超,尤其解决了 Nano Banana 2 偶尔出现的“场景逻辑错乱”问题;
- 追赶领域:在超高清分辨率(4K)渲染速度、复杂数学场景生成上,Image-2 仍有小幅差距,但已能满足绝大多数商业创作需求;
- 核心差异:Image-2 更侧重“创意实用性”,直接集成 ChatGPT 生态,而 Nano Banana 2 偏向“技术跨界拓展”,覆盖数学推导、多语言书法等场景。
发布规划:落地场景与适配范围
- 核心适配平台:Image-2 系列将优先面向 ChatGPT 用户开放,后续可能扩展到 OpenAI 旗下所有集成图像生成功能的服务,无需额外下载工具,创作流程更顺畅;
- 双版本定位:Image-2(标准版)主打全功能、高画质,满足设计师、营销团队的专业需求;Image-2-mini(轻量版)侧重快速生成、低资源占用,适合普通用户日常创意表达;
- 生态协同价值:与 GPT-5.2 同步发布后,Image-2 可能实现“文本指令-图像生成-内容优化”的全流程闭环,大幅提升多模态创作效率。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















