BRIA 开源发布了其首个文本到图像模型 FIBO —— 一个专为专业图像生成工作流设计的 JSON 原生、结构化提示驱动 的开源模型。与主流强调“想象力”的生成模型不同,FIBO 的核心目标是 可控性、可预测性与属性解耦,适用于对图像细节有精确要求的生产场景。
- GitHub:https://github.com/Bria-AI/FIBO
- 模型:https://huggingface.co/briaai/FIBO
- Demo:https://huggingface.co/spaces/briaai/FIBO
为什么 FIBO 不同?
大多数文生图模型依赖自由文本提示,容易产生“提示漂移”(prompt drift)——微调一个参数可能意外改变整体风格。而 FIBO 在 长达 1000+ 字的结构化 JSON 描述 上进行训练,明确分离光线、构图、色彩、相机参数(如焦距、景深)等维度,实现精准、可重复的控制。

尽管仅含 8B 参数,FIBO 在图像质量与提示遵循能力上表现优异,并且全部基于授权数据训练,确保企业级合规性。
三大使用模式,适配不同创作阶段
- 生成(Generate)
输入一句简单描述(如“城市夜景”),FIBO 内置语言模型会自动扩展为结构化 JSON 提示,并生成图像。输出包含图像 + 完整提示,便于后续迭代。 - 优化(Optimize)
在已有 JSON 提示基础上,添加简短指令(如“背光”、“85mm 镜头”、“肤色更暖”),FIBO 仅修改指定属性,其余保持不变,避免全局扰动。 - 启发(Inspire)
上传一张参考图,FIBO 的视觉-语言模型(VLM)会解析其结构化特征,并结合你的创意意图生成新图像——适合灵感延伸,而非简单复制。

关键特性
- JSON 原生提示:支持 VLM 自动将自然语言转为结构化模式;
- 解耦控制:独立调整相机角度、光照等参数,互不干扰;
- 企业友好:100% 授权训练数据,法律风险低;
- 生产就绪:提供 API(Bria Platform、Fal.ai、Replicate)、ComfyUI 节点,也支持本地部署。
适用场景
- 广告与电商:需严格控制产品光影与构图;
- 游戏/影视概念设计:反复迭代特定镜头参数;
- AI 工作流集成:作为可控图像生成模块嵌入专业管线。
FIBO 的开源标志着文生图模型从“创意玩具”向“生产工具”的重要演进——不是生成更多幻想,而是精准实现你的意图。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















