美团开源 5677 亿参数 LongCat-Flash-Prover:专攻数学证明,MiniF2F 通过率高达 97.1%在 AI 大模型普遍存在“逻辑幻觉”的今天,如何讓 AI 像数学家一样严谨地思考? 美团正式开源 LongCat-Flash-Prover,这是一款拥有 5677 亿参数 的混合专家模型(MoE)。它...大语言模型# LongCat-Flash-Prover# 美团3周前02020
Mistral AI 宣布开源 Mistral Small 4:119B 参数集推理、编码与多模态于一身的统一模型,推理速度提升 3 倍Mistral AI 宣布开源 Mistral Small 4。这不仅仅是一次版本迭代,更是 Mistral 在开源 AI 领域的一次战略级跨越。 作为 Mistral Small 系列的最新旗舰,S...大语言模型# Mistral AI# Mistral Small 43周前0220
MiroThinker-1.7 系列重磅发布:30B 参数刷新开源 SOTA,打造长链推理新标杆在 AI 智能体(Agent)向复杂长程任务进军的道路上,MiroThinker 团队今日正式推出了 MiroThinker-1.7 系列模型。该系列包含 MiroThinker-1.7-mini ...大语言模型# MiroThinker-1.7# MiroThinker-1.7-mini3周前0280
OpenAI 发布 GPT-5.4 mini 与 nano:极速、低价,重塑智能体经济OpenAI 正式推出 GPT-5.4 mini 和 GPT-5.4 nano,将其旗舰模型系列的能力下沉至成本与延迟曲线的底端。这两款新模型专为高吞吐量场景设计,旨在成为编程助手、子智能体(Sub...大语言模型# GPT-5.4 mini# GPT-5.4 nano# OpenAI3周前0200
限时免费体验一周!小米凌晨官宣三款大模型:MiMo-V2 系列正式亮相,1M 上下文比肩 Opus 4.6小米正式推出三款全新大模型——MiMo-V2-Pro、MiMo-V2-Omni与MiMo-V2-TTS,目前这些模型已登陆Xiaomi miclaw、MiMo Studio、金山办公、小米浏览器等平台...大语言模型# MiMo-V2# MiMo-V2-Omni# MiMo-V2-Pro3周前03920
MiniMax 发布 M2.7:首个实现“自我进化”的 Agent 模型,研发效率提升 50%2026 年 3 月18日,国内大模型独角兽 MiniMax(稀宇科技) 正式发布了新一代 Agent 旗舰大模型 M2.7。这款模型不仅刷新了多项代码与办公基准测试的纪录,更首次向外界展示了 “模型...大语言模型# M2.7# MiniMax3周前01660
英伟达发布 Nemotron 3 Super:1200 亿参数 MoE 架构,智能体吞吐量飙升 5 倍随着企业 AI 应用从简单的聊天机器人向复杂的多智能体系统(Multi-Agent Systems)演进,两大瓶颈日益凸显:上下文爆炸导致成本激增与目标漂移,以及每一步都需大模型推理带来的高昂"思考税...大语言模型# NVIDIA Nemotron 3 Super# 英伟达4周前0470
Ai2 发布 Olmo Hybrid:混合架构的“效率革命”,用一半数据训练出同等能力的 7B 模型“如果 Transformer 是记忆大师,线性 RNN 是状态追踪者,那么混合模型就是集两者之大成的‘全能选手’。” 艾伦AI研究所(Ai2)今日正式发布了 Olmo Hybrid,这是一个全新的 ...大语言模型# Olmo Hybrid# 艾伦AI研究所1个月前0290
印度SarvamAI 开源 30B/105B 推理模型,全栈自研挑战全球巨头印度初创公司 SarvamAI 开源了其旗舰推理模型系列:Sarvam 30B 和 Sarvam 105B。这两个模型不仅是目前印度本土构建的最大规模开源模型,更代表了全球范围内罕见的全栈自研(Ful...大语言模型# Sarvam 105B# Sarvam 30B# SarvamAI1个月前01290
OpenAI 发布 GPT-5.4:原生“计算机使用”能力觉醒,智能体正式接管复杂工作流“它不再只是陪你聊天的机器人,而是能真正操作你电脑、编写并调试代码、处理复杂报表的数字员工。” OpenAI 正式推出 GPT-5.4,这是 GPT-5 系列中迄今为止最强大的通用模型。它不仅继承了 ...大语言模型早报# GPT-5.4# OpenAI# 智能体1个月前0190
谷歌 Gemini 3.1 Flash-Lite 发布:首字速度快 2.5 倍,每百万输入仅$0.25,重新定义高性价比 AI在 AI 模型竞相追求更大参数、更强能力的今天,谷歌反其道而行之,推出了 Gemini 3.1 Flash-Lite。这款专为高容量、低延迟、低成本场景打造的新模型,旨在证明:在速度与效率的赛道上,轻...大语言模型早报# Gemini 3.1 Flash-Lite# 谷歌1个月前0420
OpenAI 推出 GPT-5.3 Instant:告别“说教式”拒答,幻觉率最高直降 27%,重塑日常对话体验OpenAI 今日正式向 ChatGPT 所有用户及 API 开发者推送 GPT-5.3 Instant 更新。将作为ChatGPT的默认模型,此次升级并未追求参数量或新能力的爆发,而是专注于打磨日常...大语言模型早报# GPT-5.3 Instant# OpenAI1个月前0240