Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

早报4个月前发布 小马良
494 0

据最新代码线索显示,谷歌正在为其AI图像工具 Whisk 测试一项名为 Gempix 的新功能,该功能可能代表基于 Imagen 4 的新一代图像编辑模型。

Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

这一发现来自 Google Labs 实验项目 Whisk 的前端代码,其中出现了一个名为“精准参考”(Precise Reference)的模式开关,提供三种选项:

  • 默认(Default)
  • GEM_PIX
  • R2I(可能意为“Reference to Image”)

这表明谷歌正在探索一种以参考图像为核心的AI图像生成与编辑方式,允许用户通过提供示例图来更精确地控制生成结果的风格、构图或细节。

Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

Gempix 是什么?

尽管谷歌尚未正式宣布,但综合现有信息可推测:

  • Gempix 很可能是 Imagen 4 的一个衍生版本或功能模块,专为图像编辑和参考引导生成设计。
  • 名称中的 “GEM” 可能源自 Gemini,而 “PIX” 则指向 Pixel 设备,暗示该技术可能与即将发布的 Pixel 手机深度集成。
  • 有迹象表明,Gempix 已在部分可信测试者中启用,并可能已应用于近期出现在lmarena图像竞技场中的图像编辑模型nano-banana,nano-banana展现出比 Imagen 3 更强的细节控制能力。

Whisk 中的“精准参考”模式

Whisk 目前面向公众的功能基于 Imagen 3 模型运行,但受信任的测试者已可访问 Imagen 4 的能力。新出现的“精准参考”功能正是建立在这一更先进模型之上。

三种模式的含义推测如下:

模式推测功能
Default标准生成模式,依赖文本提示
GEM_PIX基于参考图像进行高精度编辑或风格迁移,可能结合用户上传的图片
R2I (Reference to Image)广义的参考图像生成模式,或为通用功能入口

这一设计意味着未来用户在 Whisk 或 Gemini 中,不仅能“用文字画图”,还能“用一张图生成另一张图”,实现更直观、更可控的创作体验。

发布预期:或在8月20日Pixel活动亮相

考虑到命名逻辑(GEM + PIX)和谷歌的产品节奏,Gempix 及其相关功能很可能在 2025年8月20日的“Made by Google”发布会 上正式推出。

届时,谷歌预计将发布新款 Pixel 9 系列手机,而 AI 图像能力很可能是其核心卖点之一。此类功能通常会遵循以下发布路径:

  1. 首发于 Pixel 设备,作为硬件差异化优势
  2. 通过 Google Labs 或 Gemini Advanced 向测试用户开放
  3. 逐步向更广泛的用户群推广

这与谷歌近期将 AI 功能与硬件发布深度绑定的策略一致,例如 Pixel 的 Magic Editor 和 Gemini AI 的移动端集成。

战略意义:从生成到编辑的跃迁

Gempix 的出现,标志着谷歌 的 AI 图像战略正从“生成即终点”转向“生成+编辑+控制”的完整工作流。

通过将 Gemini 的原生生成能力与 Whisk 的参考驱动编辑相结合,谷歌正在构建一个更贴近专业创作者需求的 AI 图像生态——用户不仅可以快速生成图像,还能基于已有内容进行精细化调整,提升创作效率与可控性。

© 版权声明

相关文章

暂无评论

none
暂无评论...