谷歌今日正式推出了其最新图像生成模型 Nano Banana 2(技术代号:Gemini 3.1 Flash Image)。这款新模型旨在打破“速度”与“质量”不可兼得的魔咒,将 Gemini Flash 的闪电般推理速度与 Nano Banana Pro 的专业级视觉保真度完美融合。

即日起,Nano Banana 2 将成为 Gemini 应用中快速、思考和专业模式的默认图像生成引擎,为全球用户带来更逼真、更可控的创意体验。
核心突破:Flash 速度下的 Pro 级智能
Nano Banana 2 并非简单的迭代,而是谷歌图像生成技术的一次“集大成”升级。它汲取了 Gemini 庞大的现实世界知识库,并结合实时网络搜索能力,实现了以下关键飞跃:
1. 先进的世界知识与数据可视化
- 精准主体渲染:得益于对现实世界的深刻理解,模型能更准确地渲染特定地标、名人或复杂场景。
- 图文转化:不仅能画图,还能将笔记转化为信息图、将数据转化为图表,甚至生成带有准确数据的可视化内容,极大提升了生产力场景的实用性。

2. 精准文字渲染与多语言本地化
- 告别乱码:Nano Banana 2 在图像内生成文字的能力大幅提升,无论是营销海报还是节日贺卡,都能呈现清晰、准确的排版。
- 即时翻译:支持在图像内部直接翻译和本地化文字,让创意内容无缝跨越语言障碍,触达全球受众。

创意掌控力:从故事板到 4K 大片
针对专业创作者的痛点,Nano Banana 2 在控制力和画质上进行了显著增强:
- 角色一致性 (Character Consistency):
- 这是本次更新的亮点。模型能在单个工作流中保持 多达 5 个角色 的面部特征相似度,以及 多达 14 个对象 的保真度。
- 这意味着用户可以轻松创作连贯的故事板、漫画或叙事视频,而无需担心角色“换脸”。

- 精确指令遵循:
- 模型对复杂提示词的理解能力显著增强,能捕捉用户意图中的细微差别,确保“所想即所得”。
- 生产级规格支持:
- 提供从 512px 到 4K 的全分辨率支持,覆盖所有主流宽高比。无论是竖屏 TikTok/Reels 素材,还是宽屏电影背景,都能一键生成清晰大图。
- 视觉保真度升级:
- 光影效果更自然,纹理细节更丰富,色彩更鲜艳,在保持 Flash 级别生成速度的同时,达到了接近 Pro 版本的美学高度。


全生态上线:无处不在的图像生成
Nano Banana 2 已开始逐步推送至谷歌全系产品:
| 平台/产品 | 更新内容 |
|---|---|
| Gemini 应用 | 取代原版 Nano Banana,成为快速/思考/专业模式的默认模型。Pro/Ultra 订阅者仍可通过菜单切换回 Pro 版本。 |
| Google 搜索 | 在 AI 模式及 Lens 中可用,新增覆盖 141 个国家/地区 及 8 种语言。 |
| AI Studio & API | 提供预览版,开发者可立即集成。 |
| Google Cloud (Vertex AI) | 通过 Gemini API 提供预览,服务企业客户。 |
| Flow | 成为默认图像模型,对所有用户免费开放。 |
| Google Ads | 用于辅助创建营销活动素材。 |
安全与溯源:SynthID + C2PA 双重保障
在生成式媒体泛滥的今天,谷歌同步强化了内容溯源机制:
- SynthID 水印:自 11 月推出以来,已在 Gemini 应用中验证超过 2000 万次,有效帮助用户识别 AI 生成内容。
- C2PA 内容凭证:即将引入 Gemini 应用,结合不可篡改的元数据,不仅告诉用户“这是 AI 生成的”,还揭示“是如何生成的”,提供完整的上下文信息。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















