2025年12月17日,OpenAI正式推出图像生成新模型GPT-Image-1.5。这款提前上线的模型不仅将图像生成速度提升4倍,还强化了指令理解与编辑一致性,搭配创意工作室式的新界面,成为OpenAI在AI图像领域对抗谷歌的关键举措,更是其从谷歌Gemini 3和Nano Banana Pro手中夺回市场主动权的重要布局。
紧急上线背后:应对市场竞争的战略反击
此次GPT-Image-1.5的发布带有明确的竞争针对性,是OpenAI“红色警戒”状态下的关键反击动作:
- 竞品挤压倒逼升级:谷歌凭借旗舰模型Gemini 3和热门图像生成器Nano Banana Pro抢占大量市场份额,这两款产品还登顶LMArena排行榜,直接威胁到OpenAI的AI行业领导者地位。即便此前OpenAI紧急推出面向开发者和专业场景的GPT - 5.2,仍未能扭转谷歌的领先态势。
- 加速推进上线计划:据消息显示,该图像模型原定于次年一月初发布,但为了尽快应对市场竞争,OpenAI果断提速,将发布时间提前。这也是自当年四月推出GPT - Image - 1后,OpenAI在图像生成领域的首次重大版本迭代,填补了此前的产品更新空白。

核心功能升级:破解痛点,适配生产级需求
GPT - Image - 1.5跳出了单纯的参数优化,聚焦生成式AI图像工具的核心痛点,实现了从基础生成到精细加工的能力跨越,核心升级点如下:
- 效率与精准度双突破:生成速度较上一代提升高达4倍,大幅缩短创作者等待时间;同时强化了指令理解能力,能精准捕捉用户需求,避免出现对创作指令的误解读。例如用户要求“给画面人物添加眼镜”,模型可精准执行操作,而非对整体画面进行无差别调整。
- 解决迭代编辑一致性难题:这是此次升级的核心亮点。以往多数AI图像工具在进行“调整面部表情”“调冷光线”等迭代编辑时,常重新解读整张图像,导致画面元素前后矛盾。而该模型可在多次编辑中保持面部相似度、照明风格、构图比例和色调的统一,其后期制作能力已能对标谷歌Nano Banana Pro。
- 细节保留能力强化:在图像生成和编辑过程中,能更好地保留画面中的细微元素。比如生成带有复杂花纹的服饰图像时,编辑背景颜色后,服饰花纹的纹理和细节依然清晰完整,避免了编辑过程中细节模糊或丢失的问题。
交互体验革新:打造专属创意工作室
除了功能升级,OpenAI还对图像功能的交互界面进行了颠覆性改造,降低了创作门槛:
- 新增专属入口与工作室界面:ChatGPT侧边栏中增设了图像功能的专用入口,这个界面被定义为“更像一个创意工作室”。新界面不仅方便用户快速找到图像生成功能,还整合了图像查看与编辑功能,用户既能按照自己的创意创作图像,也能从热门提示和预设滤镜中获取创作灵感。
- 视觉化拓展ChatGPT体验:OpenAI计划让ChatGPT的搜索查询结果呈现更多带明确来源的视觉内容。这类视觉化呈现可适配多种场景,比如用户查询单位转换时,能通过图表直观查看换算关系;查询体育比分时,可同步显示赛事数据可视化卡片,让信息获取更高效。
适用场景与开放范围
- 全量开放覆盖:GPT-Image-1.5于发布当日面向所有ChatGPT用户开放,同时以“GPT Image 1.5”的形式接入API,兼顾普通用户的日常创作和开发者的二次开发需求。
- 适配生产级场景:当前AI图像和视频生成工具正逐步脱离原型测试阶段,迈向实际生产领域。该模型的精准编辑、一致性保留等特性,使其可广泛应用于产品演示图制作、广告创意设计、短视频素材加工等商业场景,同时也能满足个人用户制作个性化图像、教程配图等需求。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















