谷歌在 AI Studio 和 API 中推出 Imagen 4 和 Imagen 4 Ultra

早报5个月前发布 小马良
308 0

2025 年 6 月 24 日,谷歌正式发布了新一代文生图模型 Imagen 4 和更高保真版本 Imagen 4 Ultra。这两款模型现已通过 Gemini API 提供付费预览,并在 Google AI Studio 中开放有限免费试用。

这一更新不仅提升了图像质量与提示理解能力,也标志着谷歌在创意 AI 领域进一步强化了其产品矩阵。

Imagen 4 的核心特性

✅ 基础版 Imagen 4

  • 每次调用最多生成 4 张 1024 × 1024 分辨率图像
  • 支持最多 480 个 token 的提示输入
  • 默认输出包含 SynthID 数字水印,用于标识 AI 生成内容
  • 支持近实时生成,响应速度快于前代模型

🔍 Imagen 4 Ultra(高保真版本)

  • 在基础版之上进一步提升图像细节与风格一致性
  • 更强的提示对齐能力,确保输出更贴合描述意图
  • 支持通过 Vertex AI 导出 高达 2K 分辨率的图像

定价与可用性

模型单张图像成本
Imagen 4约 $0.04
Imagen 4 Ultra约 $0.06

目前可通过 Gemini API 使用,且支持请求更高的速率限制(默认为每分钟 20 次请求)。Google Cloud 用户还可享受慷慨的免费层配额,降低上手门槛。

开发者友好:统一接口与灵活集成

开发者可以使用与 Gemini 模型相同的 /generate 接口进行调用,极大简化了集成流程。这意味着:

  • 无需额外学习新的 API 标准;
  • 可轻松嵌入已有基于 Gemini 的应用中;
  • 支持快速迭代与多模态工作流构建。

此外,该模型还支持多种开发场景,包括:

  • 自动生成 UI 界面原型
  • 创作营销素材
  • 游戏美术资产生成
  • 个性化视觉内容创作

性能提升:更清晰、更准确

根据早期测试者的反馈,与前一代 Imagen 3 相比,Imagen 4 在以下方面有显著改进:

  • 字体渲染更清晰,减少模糊文字问题
  • 画面伪影明显减少,图像整体更自然
  • 颜色控制更精准,支持更复杂的艺术风格

这些改进使得 Imagen 4 在商业设计、广告创意和视觉叙事等应用场景中更具竞争力。

生态整合:纳入 Google DeepMind 创意技术栈

此次发布标志着 Google DeepMind 创意 AI 技术栈的进一步完善,目前包括:

  • Imagen 4 / Ultra:高质量图像生成
  • Veo:视频生成模型,支持复杂运动与场景变化
  • Gemini 模型家族:强大的多模态推理引擎

这些模型共同构成了一个完整的 AI 创意工具链,适用于设计师、开发者和企业用户。

战略意义:面向开发者与企业的 AI 创作平台

谷歌此次推出的 Imagen 4 系列模型,不仅是技术上的进步,更是其 AI 生态布局的关键一环:

  • 面向开发者:通过统一 API、简单计费和弹性扩缩机制,降低接入门槛;
  • 面向企业用户:Vertex AI 支持部署 Ultra 版本,满足企业级需求;
  • 强调可控性与安全性:内置 SynthID 水印,符合当前 AI 内容可追溯趋势;
  • 推动商业化落地:按需付费模式、免费试用层,吸引中小团队与初创公司尝试。
© 版权声明

相关文章

暂无评论

none
暂无评论...