2025 年 6 月 24 日,谷歌正式发布了新一代文生图模型 Imagen 4 和更高保真版本 Imagen 4 Ultra。这两款模型现已通过 Gemini API 提供付费预览,并在 Google AI Studio 中开放有限免费试用。

这一更新不仅提升了图像质量与提示理解能力,也标志着谷歌在创意 AI 领域进一步强化了其产品矩阵。
Imagen 4 的核心特性
✅ 基础版 Imagen 4
- 每次调用最多生成 4 张 1024 × 1024 分辨率图像
- 支持最多 480 个 token 的提示输入
- 默认输出包含 SynthID 数字水印,用于标识 AI 生成内容
- 支持近实时生成,响应速度快于前代模型
🔍 Imagen 4 Ultra(高保真版本)
- 在基础版之上进一步提升图像细节与风格一致性
- 更强的提示对齐能力,确保输出更贴合描述意图
- 支持通过 Vertex AI 导出 高达 2K 分辨率的图像
定价与可用性
| 模型 | 单张图像成本 |
|---|---|
| Imagen 4 | 约 $0.04 |
| Imagen 4 Ultra | 约 $0.06 |
目前可通过 Gemini API 使用,且支持请求更高的速率限制(默认为每分钟 20 次请求)。Google Cloud 用户还可享受慷慨的免费层配额,降低上手门槛。
开发者友好:统一接口与灵活集成
开发者可以使用与 Gemini 模型相同的 /generate 接口进行调用,极大简化了集成流程。这意味着:
- 无需额外学习新的 API 标准;
- 可轻松嵌入已有基于 Gemini 的应用中;
- 支持快速迭代与多模态工作流构建。
此外,该模型还支持多种开发场景,包括:
- 自动生成 UI 界面原型
- 创作营销素材
- 游戏美术资产生成
- 个性化视觉内容创作
性能提升:更清晰、更准确
根据早期测试者的反馈,与前一代 Imagen 3 相比,Imagen 4 在以下方面有显著改进:
- 字体渲染更清晰,减少模糊文字问题
- 画面伪影明显减少,图像整体更自然
- 颜色控制更精准,支持更复杂的艺术风格
这些改进使得 Imagen 4 在商业设计、广告创意和视觉叙事等应用场景中更具竞争力。

生态整合:纳入 Google DeepMind 创意技术栈
此次发布标志着 Google DeepMind 创意 AI 技术栈的进一步完善,目前包括:
- Imagen 4 / Ultra:高质量图像生成
- Veo:视频生成模型,支持复杂运动与场景变化
- Gemini 模型家族:强大的多模态推理引擎
这些模型共同构成了一个完整的 AI 创意工具链,适用于设计师、开发者和企业用户。
战略意义:面向开发者与企业的 AI 创作平台
谷歌此次推出的 Imagen 4 系列模型,不仅是技术上的进步,更是其 AI 生态布局的关键一环:
- 面向开发者:通过统一 API、简单计费和弹性扩缩机制,降低接入门槛;
- 面向企业用户:Vertex AI 支持部署 Ultra 版本,满足企业级需求;
- 强调可控性与安全性:内置 SynthID 水印,符合当前 AI 内容可追溯趋势;
- 推动商业化落地:按需付费模式、免费试用层,吸引中小团队与初创公司尝试。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















