英伟达发布 Nemotron 3 系列：30B Nano 即用，Super/Ultra 2026 年登场

38 0

英伟达正式推出 Nemotron 3 开源模型系列，聚焦多智能体协作场景，包含 Nano、Super、Ultra 三个版本，覆盖从轻量推理到超大规模智能体系统的全栈需求。

模型：https://huggingface.co/collections/nvidia/nvidia-nemotron-v3

其中，Nemotron 3 Nano 已立即开源可用，而更大规模的 Super（100B） 与 Ultra（500B） 版本计划于 2026 年上半年 发布，将首次采用基于 Blackwell 架构 的 4 位 NVFP4 训练格式，显著降低显存与计算开销。

英伟达发布 Nemotron 3 系列：30B Nano 即用，Super/Ultra 2026 年登场

Nemotron 3 Nano：即用型智能体基础模型

参数规模：300 亿总参数，每任务激活约 30 亿（MoE 架构）
上下文窗口：100 万 token，支持超长文档、代码库或对话历史处理
性能提升：相比前代，吞吐量提升最高 4 倍
目标场景：调试辅助、内容摘要、信息检索、轻量级智能体任务

该模型专为高吞吐、低成本场景优化，可在单张消费级 GPU（如 RTX 4090）或主流云实例上高效运行，适合集成到开发工具链、客服系统或内部知识引擎中。

Super 与 Ultra：面向复杂多智能体工作流

Nemotron 3 Super：1000 亿参数
Nemotron 3 Ultra：5000 亿参数
发布计划：2026 年上半年
核心技术：基于 Blackwell GPU 架构 的 NVFP4（4-bit NVIDIA Floating Point）训练格式

NVFP4 是英伟达自研的低精度浮点格式，在保持训练稳定性的同时，大幅减少内存占用与通信带宽需求，使超大规模模型能在现有集群上高效训练与推理。

这两款模型专为多智能体协同任务设计，例如：

自动化软件开发流水线（规划 → 编码 → 测试 → 部署）
企业级决策支持系统（数据收集 → 分析 → 报告生成 → 执行建议）
复杂仿真与规划（物流、金融、科研）

开源与生态支持

英伟达同步开放：

训练数据集（部分开源）
强化学习库（用于智能体对齐与优化）
部署工具链：支持主流云平台（AWS、Azure、GCP）及本地 NVIDIA AI Enterprise 环境

此举旨在推动透明、可审计、可复现的智能体开发，避免“黑箱式”AI系统。

行业反馈与定位

早期采用者：已有多家领先企业与初创公司集成 Nemotron 3 Nano
独立评测：第三方基准测试显示，其在吞吐效率与任务准确率上优于同规模开源模型
战略定位：Nemotron 系列不仅是模型，更是NVIDIA AI 全栈能力的延伸——从 GPU（Blackwell）、软件栈（TensorRT-LLM）、到智能体框架（Nemotron）