一个轻量但高效的图像生成模型——Nano-banana(即 Google 的 Gemini 2.5 Flash 图像模型)现已接入 ComfyUI,通过原生 API 节点实现无缝集成。

你无需离开熟悉的 ComfyUI 画布,就能调用这一最新生成模型,完成从文本到图像、图像到图像的多种任务。整个流程稳定、直观,适合嵌入现有工作流。
什么是 Nano-banana?
Nano-banana 并非字面意义上的“纳米香蕉”,而是谷歌推出的高效多模态模型 Gemini 2.5 Flash 在图像生成场景下的代称。它在速度与质量之间实现了良好平衡,特别适合需要快速迭代的创意或开发场景。
该模型具备以下核心能力:
- 高角色一致性:在生成人物形象时,能较好保持面部特征和风格统一
- 双模式支持:支持文本生成图像(Text-to-Image)和图像生成图像(Image-to-Image)
- 可选文本输出:部分调用可同时返回描述性文本,便于后续处理或标注
- 灵活分辨率:支持自定义输出尺寸与宽高比,适配不同使用需求

如何开始使用?
只需三步,即可在 ComfyUI 中启用 Nano-banana:
1. 更新 ComfyUI:当前需使用 nightly 版本(开发版)。Stable 版本及桌面客户端支持已在开发中,即将上线。

2.添加节点:在 ComfyUI 画布中双击空白区域,搜索 “Google Gemini Image” 节点,将其拖入工作区。

3.运行工作流:配置提示词、参数和图像输入(如适用),连接输出节点后点击运行,即可获得生成结果。

所有操作均在本地界面完成,调用过程透明,便于调试与集成。

关于 Token 成本
Nano-banana 通过 API 接口调用,按实际使用的 输入与输出 Token 数量计费,费用标准与 Google Gemini 官方定价一致。
- 输入内容(提示词、图像编码等)和输出图像均会消耗 Token
- 具体成本取决于请求复杂度和生成分辨率
- 建议在正式使用前评估典型任务的消耗水平,合理规划调用频率
目前不提供免费额度,需确保账户已绑定有效计费方式。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















