英伟达发布 Nemotron 3 系列:30B Nano 即用,Super/Ultra 2026 年登场英伟达正式推出 Nemotron 3 开源模型系列,聚焦多智能体协作场景,包含 Nano、Super、Ultra 三个版本,覆盖从轻量推理到超大规模智能体系统的全栈需求。 模型:https://hug...大语言模型# Nemotron 3# 英伟达1个月前0270
艾伦AI研究所推出 Olmo 3.1:更强的 32B 开源聊天与推理模型艾伦人工智能研究所(AI2)发布了 Olmo 3.1,这是 Olmo 3 系列的最新迭代。此次更新包含两个 32B 参数的新模型检查点,以及多个 7B 规模的强化学习变体,进一步推动了高性能与全开源的...大语言模型# Olmo 3.11个月前0410
FunctionGemma:谷歌发布 2.7 亿参数边缘函数调用模型,让设备“听懂即执行”在 Gemini 3 引发广泛关注的同时,谷歌悄然推出了一款面向边缘设备的专用小模型——FunctionGemma。它不是另一个聊天机器人,而是一个能在手机、浏览器或 IoT 设备上本地运行的“行动引...大语言模型# FunctionGemma# 谷歌# 边缘函数调用模型1个月前0320
OpenAI正式发布GPT-5.2 :GDPval 超人类专家,编码/长上下文/视觉能力全面跃升OpenAI 再度刷新大模型天花板——GPT-5.2 正式发布。这款专为专业知识工作和长期运行智能体打造的前沿模型,在编码、长上下文推理、视觉理解、工具调用等核心能力上实现跨越式提升,甚至在覆盖 44...大语言模型早报# GPT-5.2# OpenAI2个月前0500
Mistral AI 发布 Devstral 2 编程模型+Vibe CLI:1230亿参数适配智能体开发,终端原生编程更高效Mistral AI 推出两大核心产品——新一代软件工程智能体编程模型家族 Devstral 2,以及开源命令行编程助手 Mistral Vibe CLI。前者以高参数、长上下文和高性价比成为开源编程...大语言模型# Devstral 2# Mistral AI# 编程模型2个月前0330
腾讯发布混元 2.0 大模型:406B MoE 架构,256K 上下文,推理效率国内领先腾讯正式发布自研大模型 混元 2.0(Tencent HY 2.0),包含 HY 2.0 Think(推理优化版)与 HY 2.0 Instruct(指令对齐版)两个版本。该模型采用 混合专家(MoE...大语言模型# 混元 2.0 大模型# 腾讯2个月前0310
亚马逊推出全新Nova模型系列及开创性服务:Nova Forge与Nova Act核心要点 Nova 2 模型系列在推理、多模态处理、对话式AI、代码生成及智能体任务方面提供业界领先的性价比。 Nova Forge 服务允许企业通过其独特的“开放训练”方法,在训练早期融入专有数据...大语言模型# NOVA# Nova Act# Nova Forge2个月前0240
DeepSeek V3.2正式发布:推理能力追平GPT-5,首个思考+工具调用开源模型经过两个多月测试,DeepSeek 正式推出 V3.2 系列模型,包括平衡型主力版本 DeepSeek V3.2 与极致推理增强版 DeepSeek V3.2 Speciale。前者以“推理能力不逊 ...大语言模型早报# DeepSeek V3.22个月前01310
685B参数DeepSeekMath-V2开源!IMO/CMO金牌+Putnam近满分,颠覆数学推理范式数学推理领域迎来里程碑式突破!DeepSeek AI 正式发布开源数学模型 DeepSeekMath-V2,这款基于 685B 参数专家混合(MoE)架构的模型,不仅在 IMO 2025、CMO 20...大语言模型# DeepSeek# DeepSeekMath-V2# 深度求索2个月前0240
微软推出Fara - 7B模型:70亿参数本地运行,专为计算机使用代理 (CUA) 设计的小型语言模型微软正式推出首款专为计算机使用代理(CUA)设计的小型语言模型Fara - 7B。这款仅70亿参数的模型跳出了对大规模云端模型的依赖,凭借可本地运行的特性,在降低延迟的同时筑牢数据隐私防线,更以独特的...大语言模型# Fara - 7B# 微软# 计算机使用代理2个月前0150
Anthropic 发布 Claude Opus 4.5:宣称全球最佳编程模型,API 降价+多平台同步上线Anthropic 今日正式发布旗舰级 AI 模型 Claude Opus 4.5,聚焦编程、代理任务与计算机使用场景,凭借多项核心突破重塑行业标杆。该模型不仅在 SWE-bench Verified...大语言模型# Anthropic# Claude Opus 4.5# 编程模型2个月前0280
艾伦AI研究所发布Olmo 3系列模型:完全开放的推理模型,训练数据与中间步骤全透明在开源AI领域,“开放”往往局限于最终模型权重的分享,而模型训练的数据、流程、中间检查点等核心环节仍处于“黑箱”状态。Ai2(艾伦人工智能研究所)最新发布的 Olmo 3 系列模型,彻底打破了这一现状...大语言模型# Olmo 3# 艾伦AI研究所2个月前01900