IBM 发布 Granite 4.0 Nano：350M-1.5B 参数边缘模型，混合SSM架构+Apache 2.0开源，性能超越同尺寸竞品

23 0

在边缘计算与设备端AI需求日益增长的今天，“小模型能否实现强能力”成为行业核心诉求。近日，IBM 正式推出 Granite 4.0 Nano 系列模型——作为 Granite 4.0 家族的全新成员，该系列专为边缘设备设计，参数量仅 350M 至 1.5B，却在通用知识、编程、工具调用等核心任务中超越同尺寸竞品，同时提供混合 SSM 架构与传统 Transformer 双版本，以 Apache 2.0 开源许可开放，为设备端AI应用带来高性能、低门槛的解决方案。

模型：https://huggingface.co/collections/ibm-granite/granite-40-nano-language-models

IBM 发布 Granite 4.0 Nano：350M-1.5B 参数边缘模型，混合SSM架构+Apache 2.0开源，性能超越同尺寸竞品

核心亮点：小参数，大能力，多场景适配

Granite 4.0 Nano 的核心竞争力在于“轻量化与高性能的完美平衡”，同时兼顾灵活性与合规性，具体亮点如下：

1. 双架构并行，适配不同部署需求

IBM 创新性地为 Nano 系列提供两种架构版本，覆盖更多应用场景：

混合 SSM 架构版本（Granite 4.0 H 1B/350M）：采用 Granite 4.0 家族全新高效混合架构，融合状态空间模型（SSMs）的优势，在低参数下实现更优的推理效率与任务性能，适合追求极致轻量化部署的场景；
传统 Transformer 版本（Granite 4.0 1B/350M）：适配尚未对混合架构完全优化的工作负载（如 llama.cpp 运行时），确保开发者无需调整现有部署环境即可快速接入，降低迁移成本。

2. 性能越级：同尺寸模型中表现突出

尽管参数量仅 350M-1.5B，Granite 4.0 Nano 凭借优化的训练方法与超 15T tokens 的海量训练数据，在多项基准测试中展现出越级实力：

通用能力：在通用知识、数学、安全等领域的通用基准测试中，超越阿里巴巴 Qwen、LiquidAI LFM、谷歌 Gemma 等同尺寸竞品；
代理核心能力：在指令遵循（IFEval 基准）、工具调用（伯克利函数调用排行榜 v3 BFCLv3）等代理工作流关键任务中表现优异，为边缘设备实现智能代理功能提供可能；
实用技能：支持编程等专业任务，满足边缘场景下的轻量化开发需求。

3. 开源合规，部署无门槛

授权模式：采用宽松的 Apache 2.0 许可，允许开发者自由使用、修改、部署，无商业使用限制；
生态兼容：原生支持 vLLM、llama.cpp、MLX 等主流运行时，无需额外适配即可快速部署到边缘设备；
合规保障：具备 IBM ISO 42001 负责任模型开发认证，符合全球标准的模型构建与治理规范，企业用户可放心使用。

模型矩阵：4款型号，覆盖不同边缘场景

Granite 4.0 Nano 系列包含 4 个指令微调模型及对应的基础模型，精准匹配不同边缘设备的算力需求：

模型名称	参数量	架构类型	核心优势
Granite 4.0 H 1B	约 1.5B	混合 SSM 架构	高性能优先，适合算力中等的边缘设备
Granite 4.0 H 350M	约 350M	混合 SSM 架构	极致轻量化，适配低算力设备
Granite 4.0 1B	1B	传统 Transformer	兼容现有部署环境，稳定性优先
Granite 4.0 350M	350M	传统 Transformer	轻量兼容，适合简单边缘任务