据最新代码线索显示,谷歌正在为其AI图像工具 Whisk 测试一项名为 Gempix 的新功能,该功能可能代表基于 Imagen 4 的新一代图像编辑模型。

这一发现来自 Google Labs 实验项目 Whisk 的前端代码,其中出现了一个名为“精准参考”(Precise Reference)的模式开关,提供三种选项:
- 默认(Default)
- GEM_PIX
- R2I(可能意为“Reference to Image”)
这表明谷歌正在探索一种以参考图像为核心的AI图像生成与编辑方式,允许用户通过提供示例图来更精确地控制生成结果的风格、构图或细节。

Gempix 是什么?
尽管谷歌尚未正式宣布,但综合现有信息可推测:
- Gempix 很可能是 Imagen 4 的一个衍生版本或功能模块,专为图像编辑和参考引导生成设计。
- 名称中的 “GEM” 可能源自 Gemini,而 “PIX” 则指向 Pixel 设备,暗示该技术可能与即将发布的 Pixel 手机深度集成。
- 有迹象表明,Gempix 已在部分可信测试者中启用,并可能已应用于近期出现在lmarena图像竞技场中的图像编辑模型nano-banana,nano-banana展现出比 Imagen 3 更强的细节控制能力。
Whisk 中的“精准参考”模式
Whisk 目前面向公众的功能基于 Imagen 3 模型运行,但受信任的测试者已可访问 Imagen 4 的能力。新出现的“精准参考”功能正是建立在这一更先进模型之上。
三种模式的含义推测如下:
| 模式 | 推测功能 |
|---|---|
| Default | 标准生成模式,依赖文本提示 |
| GEM_PIX | 基于参考图像进行高精度编辑或风格迁移,可能结合用户上传的图片 |
| R2I (Reference to Image) | 广义的参考图像生成模式,或为通用功能入口 |
这一设计意味着未来用户在 Whisk 或 Gemini 中,不仅能“用文字画图”,还能“用一张图生成另一张图”,实现更直观、更可控的创作体验。
发布预期:或在8月20日Pixel活动亮相
考虑到命名逻辑(GEM + PIX)和谷歌的产品节奏,Gempix 及其相关功能很可能在 2025年8月20日的“Made by Google”发布会 上正式推出。
届时,谷歌预计将发布新款 Pixel 9 系列手机,而 AI 图像能力很可能是其核心卖点之一。此类功能通常会遵循以下发布路径:
- 首发于 Pixel 设备,作为硬件差异化优势
- 通过 Google Labs 或 Gemini Advanced 向测试用户开放
- 逐步向更广泛的用户群推广
这与谷歌近期将 AI 功能与硬件发布深度绑定的策略一致,例如 Pixel 的 Magic Editor 和 Gemini AI 的移动端集成。
战略意义:从生成到编辑的跃迁
Gempix 的出现,标志着谷歌 的 AI 图像战略正从“生成即终点”转向“生成+编辑+控制”的完整工作流。
通过将 Gemini 的原生生成能力与 Whisk 的参考驱动编辑相结合,谷歌正在构建一个更贴近专业创作者需求的 AI 图像生态——用户不仅可以快速生成图像,还能基于已有内容进行精细化调整,提升创作效率与可控性。















