谷歌发布 Nano Banana 2：融合 Flash 速度与 Pro 级画质，角色一致性高达 5 人

83 0

谷歌今日正式推出了其最新图像生成模型 Nano Banana 2（技术代号：Gemini 3.1 Flash Image）。这款新模型旨在打破“速度”与“质量”不可兼得的魔咒，将 Gemini Flash 的闪电般推理速度与 Nano Banana Pro 的专业级视觉保真度完美融合。

谷歌发布 Nano Banana 2：融合 Flash 速度与 Pro 级画质，角色一致性高达 5 人

即日起，Nano Banana 2 将成为 Gemini 应用中快速、思考和专业模式的默认图像生成引擎，为全球用户带来更逼真、更可控的创意体验。

核心突破：Flash 速度下的 Pro 级智能

Nano Banana 2 并非简单的迭代，而是谷歌图像生成技术的一次“集大成”升级。它汲取了 Gemini 庞大的现实世界知识库，并结合实时网络搜索能力，实现了以下关键飞跃：

1. 先进的世界知识与数据可视化

精准主体渲染：得益于对现实世界的深刻理解，模型能更准确地渲染特定地标、名人或复杂场景。
图文转化：不仅能画图，还能将笔记转化为信息图、将数据转化为图表，甚至生成带有准确数据的可视化内容，极大提升了生产力场景的实用性。

2. 精准文字渲染与多语言本地化

告别乱码：Nano Banana 2 在图像内生成文字的能力大幅提升，无论是营销海报还是节日贺卡，都能呈现清晰、准确的排版。
即时翻译：支持在图像内部直接翻译和本地化文字，让创意内容无缝跨越语言障碍，触达全球受众。

创意掌控力：从故事板到 4K 大片

针对专业创作者的痛点，Nano Banana 2 在控制力和画质上进行了显著增强：

角色一致性 (Character Consistency)：
- 这是本次更新的亮点。模型能在单个工作流中保持 多达 5 个角色 的面部特征相似度，以及 多达 14 个对象 的保真度。
- 这意味着用户可以轻松创作连贯的故事板、漫画或叙事视频，而无需担心角色“换脸”。

精确指令遵循：
- 模型对复杂提示词的理解能力显著增强，能捕捉用户意图中的细微差别，确保“所想即所得”。
生产级规格支持：
- 提供从 512px 到 4K 的全分辨率支持，覆盖所有主流宽高比。无论是竖屏 TikTok/Reels 素材，还是宽屏电影背景，都能一键生成清晰大图。
视觉保真度升级：
- 光影效果更自然，纹理细节更丰富，色彩更鲜艳，在保持 Flash 级别生成速度的同时，达到了接近 Pro 版本的美学高度。

全生态上线：无处不在的图像生成

Nano Banana 2 已开始逐步推送至谷歌全系产品：

平台/产品	更新内容
Gemini 应用	取代原版 Nano Banana，成为快速/思考/专业模式的默认模型。Pro/Ultra 订阅者仍可通过菜单切换回 Pro 版本。
Google 搜索	在 AI 模式及 Lens 中可用，新增覆盖 141 个国家/地区及 8 种语言。
AI Studio & API	提供预览版，开发者可立即集成。
Google Cloud (Vertex AI)	通过 Gemini API 提供预览，服务企业客户。
Flow	成为默认图像模型，对所有用户免费开放。
Google Ads	用于辅助创建营销活动素材。

安全与溯源：SynthID + C2PA 双重保障

在生成式媒体泛滥的今天，谷歌同步强化了内容溯源机制：

SynthID 水印：自 11 月推出以来，已在 Gemini 应用中验证超过 2000 万次，有效帮助用户识别 AI 生成内容。
C2PA 内容凭证：即将引入 Gemini 应用，结合不可篡改的元数据，不仅告诉用户“这是 AI 生成的”，还揭示“是如何生成的”，提供完整的上下文信息。