谷歌nano-banana模型落地在即：Flow将添文本转图像功能，同步优化创作者工作流

509 0

随着谷歌 nano-banana模型的发布预期逐渐升温，其生态落地布局也在稳步推进——这款模型不仅计划集成到Gemini、Whisk等现有工具中，最新迹象显示，它还将登陆创意平台Flow，为其带来全新的“文本转图像”功能。与此同时，谷歌还在为Flow测试竖屏比例、提示“前导”、社交分享等实用更新，旨在将Flow打造成“图像+视频”一体化创作环境，减少创作者在不同平台间迁移资产的麻烦，契合谷歌“让创意工具更易用、更多样”的长期目标。

谷歌nano-banana模型落地在即：Flow将添文本转图像功能，同步优化创作者工作流

nano-banana模型赋能Flow：文本转图像支持参考图，瞄准视频创作需求

此次Flow的核心功能升级，围绕“nano-banana模型驱动的文本转图像”展开，且功能设计深度贴合视频创作者的实际需求：

1. 参考图+文本，生成视频适用的图像变体

与普通文本转图像工具不同，Flow的新功能允许用户上传参考图像——比如创作者先导入一张“户外露营场景”的参考图，再输入文本提示“将场景改为冬季雪景，保留帐篷位置与光影风格”，系统会基于nano-banana模型的多模态能力，生成多个符合要求的图像变体。更关键的是，这些生成的图像并非仅用于静态展示，而是针对“视频创作”优化：尺寸、分辨率、色彩空间均适配主流视频剪辑需求，创作者可直接将其导入Flow的视频轨道，无需额外调整格式，实现“图像生成-视频制作”的无缝衔接。

这一设计的核心价值在于“减少跨工具操作”：以往创作者需在专门的图像生成工具（如MidJourney）中生成素材，再导出至视频剪辑软件，过程中可能面临格式不兼容、色彩偏差等问题；而Flow整合该功能后，可在同一环境内完成“图像创意生成-视频整合制作”，大幅提升创作效率。

2. nano-banana模型的技术支撑：强化多模态与参考图创作

nano-banana模型本身的技术特性，是此次功能升级的关键——它在“基于参考的图像生成”和“多模态理解”方面表现突出：既能精准捕捉参考图的构图、风格、细节特征，又能深度解析文本提示的创意需求，确保生成的图像既贴合用户构想，又与参考图保持逻辑关联。例如，参考图中若包含“手持相机的人物”，文本提示“将相机改为无人机”，模型能准确识别人物动作与物体位置，生成自然的替换效果，避免出现比例失调、场景割裂等问题。

这一能力与谷歌的创意工具战略高度契合：无论是Gemini的多模态交互，还是Whisk的食谱生成，nano-banana模型的落地都在强化“AI理解用户创意、辅助落地”的核心目标，而Flow的此次升级，正是该战略在“视频创作领域”的具体延伸。

Flow同步测试实用更新：适配竖屏平台，降低创作门槛，优化社交体验

除了核心的文本转图像功能，谷歌还在为Flow测试三项针对性更新，覆盖“平台适配”“创作门槛”“内容分享”三大创作者痛点：

1. 纵向宽高比选项：适配TikTok/YouTube Shorts等竖屏场景

随着短视频平台（如TikTok、YouTube Shorts）的普及，竖屏内容创作需求持续增长。此次Flow测试的“纵向宽高比选项”，可直接提供9:16等主流竖屏比例模板——创作者无需在视频制作完成后手动裁剪画面，从图像生成、视频剪辑到导出，全程可按竖屏规格创作，尤其适合专注于短视频领域的Vlogger、自媒体人。

2. 提示“前导”预设：无提示工程经验也能出好效果

针对“普通用户不懂提示工程”的痛点，Flow新增“提示前导（preambles）”功能：用户可选择“Vlogging（日常记录）”“Cinematic（电影感）”“Anime（动漫风格）”等预设模板，系统会自动在用户输入的基础提示后，补充专业的风格描述、细节指令。例如，用户输入“记录周末公园散步”并选择“Vlogging”预设，系统会自动扩展为“记录周末公园散步，手持镜头质感，自然光线，色彩明亮，包含落叶、长椅等场景细节，适合短视频平台发布”，帮助缺乏经验的用户快速生成高质量提示，提升图像与视频的创作效果。

这一设计大幅降低了AI创意工具的使用门槛，让休闲创作者无需学习复杂的提示技巧，也能获得符合预期的输出，进一步扩大Flow的用户覆盖范围。

3. 社交功能升级：收藏与二维码分享，优化内容管理

为提升平台内的内容流转效率，Flow还在开发两项社交相关功能：

视频收藏：创作者可将平台内的优质视频素材、自己的草稿作品添加收藏，分类管理，方便后续查找与复用，尤其适合长期积累创作素材的用户；
二维码分享：完成创作后，可生成专属二维码，扫描后直接跳转至作品页面——无论是分享给团队协作伙伴，还是发布到社交媒体引流，都比传统链接分享更便捷，且能减少平台外传播时的格式丢失问题。

这些“小而实用”的更新，虽不涉及核心技术突破，但精准解决了创作者在“内容管理”和“外部分享”中的高频痛点，让Flow的使用体验更贴合实际创作流程。

功能落地节奏：尚无明确时间表，契合谷歌创意生态整合战略

目前，谷歌尚未公布nano-banana模型及Flow相关新功能的正式发布时间，但从“多平台同步测试”的动作来看，这些功能已进入后期优化阶段，预计将在收集足够用户反馈、确保稳定性后逐步推送。

从更宏观的战略层面来看，此次Flow的功能扩展，是谷歌“整合创意工作流”的重要一步：通过nano-banana模型串联Gemini（多模态交互）、Whisk（生活创意）、Flow（图像+视频创作）等工具，构建覆盖“创意构思-素材生成-内容制作-分享传播”的全链路生态，既能满足数字创作者“快速变化的需求”，也能强化谷歌在AI创意工具领域的竞争力。

对创作者而言，后续可重点关注Flow的官方更新通知——一旦文本转图像、竖屏适配等功能落地，无论是短视频制作、自媒体内容创作，还是创意原型设计，都能在Flow中获得更高效、更一体化的体验，尤其适合需要频繁处理“图像+视频”素材的用户。