随着谷歌nano-banana模型的发布预期逐渐升温,其生态落地布局也在稳步推进——这款模型不仅计划集成到Gemini、Whisk等现有工具中,最新迹象显示,它还将登陆创意平台Flow,为其带来全新的“文本转图像”功能。与此同时,谷歌还在为Flow测试竖屏比例、提示“前导”、社交分享等实用更新,旨在将Flow打造成“图像+视频”一体化创作环境,减少创作者在不同平台间迁移资产的麻烦,契合谷歌“让创意工具更易用、更多样”的长期目标。

nano-banana模型赋能Flow:文本转图像支持参考图,瞄准视频创作需求
此次Flow的核心功能升级,围绕“nano-banana模型驱动的文本转图像”展开,且功能设计深度贴合视频创作者的实际需求:
1. 参考图+文本,生成视频适用的图像变体
与普通文本转图像工具不同,Flow的新功能允许用户上传参考图像——比如创作者先导入一张“户外露营场景”的参考图,再输入文本提示“将场景改为冬季雪景,保留帐篷位置与光影风格”,系统会基于nano-banana模型的多模态能力,生成多个符合要求的图像变体。更关键的是,这些生成的图像并非仅用于静态展示,而是针对“视频创作”优化:尺寸、分辨率、色彩空间均适配主流视频剪辑需求,创作者可直接将其导入Flow的视频轨道,无需额外调整格式,实现“图像生成-视频制作”的无缝衔接。
这一设计的核心价值在于“减少跨工具操作”:以往创作者需在专门的图像生成工具(如MidJourney)中生成素材,再导出至视频剪辑软件,过程中可能面临格式不兼容、色彩偏差等问题;而Flow整合该功能后,可在同一环境内完成“图像创意生成-视频整合制作”,大幅提升创作效率。
2. nano-banana模型的技术支撑:强化多模态与参考图创作
nano-banana模型本身的技术特性,是此次功能升级的关键——它在“基于参考的图像生成”和“多模态理解”方面表现突出:既能精准捕捉参考图的构图、风格、细节特征,又能深度解析文本提示的创意需求,确保生成的图像既贴合用户构想,又与参考图保持逻辑关联。例如,参考图中若包含“手持相机的人物”,文本提示“将相机改为无人机”,模型能准确识别人物动作与物体位置,生成自然的替换效果,避免出现比例失调、场景割裂等问题。
这一能力与谷歌的创意工具战略高度契合:无论是Gemini的多模态交互,还是Whisk的食谱生成,nano-banana模型的落地都在强化“AI理解用户创意、辅助落地”的核心目标,而Flow的此次升级,正是该战略在“视频创作领域”的具体延伸。
Flow同步测试实用更新:适配竖屏平台,降低创作门槛,优化社交体验
除了核心的文本转图像功能,谷歌还在为Flow测试三项针对性更新,覆盖“平台适配”“创作门槛”“内容分享”三大创作者痛点:
1. 纵向宽高比选项:适配TikTok/YouTube Shorts等竖屏场景
随着短视频平台(如TikTok、YouTube Shorts)的普及,竖屏内容创作需求持续增长。此次Flow测试的“纵向宽高比选项”,可直接提供9:16等主流竖屏比例模板——创作者无需在视频制作完成后手动裁剪画面,从图像生成、视频剪辑到导出,全程可按竖屏规格创作,尤其适合专注于短视频领域的Vlogger、自媒体人。
2. 提示“前导”预设:无提示工程经验也能出好效果
针对“普通用户不懂提示工程”的痛点,Flow新增“提示前导(preambles)”功能:用户可选择“Vlogging(日常记录)”“Cinematic(电影感)”“Anime(动漫风格)”等预设模板,系统会自动在用户输入的基础提示后,补充专业的风格描述、细节指令。例如,用户输入“记录周末公园散步”并选择“Vlogging”预设,系统会自动扩展为“记录周末公园散步,手持镜头质感,自然光线,色彩明亮,包含落叶、长椅等场景细节,适合短视频平台发布”,帮助缺乏经验的用户快速生成高质量提示,提升图像与视频的创作效果。
这一设计大幅降低了AI创意工具的使用门槛,让休闲创作者无需学习复杂的提示技巧,也能获得符合预期的输出,进一步扩大Flow的用户覆盖范围。
3. 社交功能升级:收藏与二维码分享,优化内容管理
为提升平台内的内容流转效率,Flow还在开发两项社交相关功能:
- 视频收藏:创作者可将平台内的优质视频素材、自己的草稿作品添加收藏,分类管理,方便后续查找与复用,尤其适合长期积累创作素材的用户;
- 二维码分享:完成创作后,可生成专属二维码,扫描后直接跳转至作品页面——无论是分享给团队协作伙伴,还是发布到社交媒体引流,都比传统链接分享更便捷,且能减少平台外传播时的格式丢失问题。
这些“小而实用”的更新,虽不涉及核心技术突破,但精准解决了创作者在“内容管理”和“外部分享”中的高频痛点,让Flow的使用体验更贴合实际创作流程。
功能落地节奏:尚无明确时间表,契合谷歌创意生态整合战略
目前,谷歌尚未公布nano-banana模型及Flow相关新功能的正式发布时间,但从“多平台同步测试”的动作来看,这些功能已进入后期优化阶段,预计将在收集足够用户反馈、确保稳定性后逐步推送。
从更宏观的战略层面来看,此次Flow的功能扩展,是谷歌“整合创意工作流”的重要一步:通过nano-banana模型串联Gemini(多模态交互)、Whisk(生活创意)、Flow(图像+视频创作)等工具,构建覆盖“创意构思-素材生成-内容制作-分享传播”的全链路生态,既能满足数字创作者“快速变化的需求”,也能强化谷歌在AI创意工具领域的竞争力。
对创作者而言,后续可重点关注Flow的官方更新通知——一旦文本转图像、竖屏适配等功能落地,无论是短视频制作、自媒体内容创作,还是创意原型设计,都能在Flow中获得更高效、更一体化的体验,尤其适合需要频繁处理“图像+视频”素材的用户。















