美团 LongCat 团队发布 LongCat-Flash-Thinking:具备形式化与智能体推理能力的新一代高效推理模型美团 LongCat 团队正式推出 LongCat-Flash-Thinking——一款专注于高复杂度任务推理的大型语言模型(LRM)。该模型在保持前代 LongCat-Flash-Chat 高效响应...大语言模型# LongCat-Flash-Thinking# 推理模型# 美团3个月前01370
FastMTP:通过增强多令牌预测提升大模型推理效率在大语言模型(LLM)的实际应用中,推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升,但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码(Speculative Dec...大语言模型# FastMTP# 推理模型3个月前01300
蚂蚁集团推出推理模型 Ring-mini-2.0蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B,但每个输入 token 仅激活 14 亿个参数(非嵌入参数部分为 7.89 亿)。尽管 Ring-mini...大语言模型# Ring-mini-2.0# 推理模型# 蚂蚁集团3个月前0970
3D-R1:让大模型真正理解三维空间的统一推理模型上海工程技术大学与北京大学计算机学院联合提出一个开源通用模型 3D-R1,旨在提升3D视觉-语言模型(3D Vision-Language Models, 3D-VLMs)在复杂场景中的推理能力,推动...3D模型# 3D-R1# 推理模型4个月前01280
阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507:复杂任务表现大幅提升阿里通义千问团队再次升级其 30B 级模型线,正式推出 Qwen3-30B-A3B-Thinking-2507。 这并非一次简单迭代,而是针对复杂推理能力的深度优化版本。过去三个月中,项目组重点提升了...大语言模型# Qwen3-30B-A3B-Thinking-2507# 推理模型4个月前03400
阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507:深度推理能力再升级在持续三个月的优化后,阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升,进一步巩固了其在开源思维...大语言模型# Qwen3-235B-A22B-Thinking-2507# 推理模型4个月前01850
月之暗面开源智能代理基础模型Kimi K2,参数达 1T,激活参数 32B月之暗面正式发布其新一代 MoE 架构大模型——Kimi K2,并同步开源。该模型具备卓越的代码能力、数学推理能力以及智能代理(Agent)任务处理能力,是目前最适配于构建自主化智能系统的开源基础模型...大语言模型# Kimi K2# 推理模型# 智能代理模型5个月前01210
Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级Reka AI 正式发布了其推理模型 Reka Flash 3.1,这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出,并作为 Re...大语言模型# Reka AI# Reka Flash 3.1# 推理模型5个月前01360
驳“大型推理模型不是真正的智能模型”:Claude Opus第一作者发文指出苹果论文实验设计局限近日,Anthropic 研究团队在一篇新发布的论文中,对苹果公司 Shojaee 等人(2025)提出的观点进行了系统性反驳。该观点认为:大型推理模型(LRMs)在复杂规划任务中表现出“准确性崩溃...早报# Claude Opus# 推理模型# 苹果6个月前02020
开发者喜讯!OpenAI 宣布最强推理模型 o3 价格下调 80%OpenAI今天宣布对其旗舰推理大模型 o3 进行史无前例的价格下调——输入和输出 Token 成本均降低 80%!这项决定不仅让开发者拍手叫好,也让整个 AI 行业为之震动。 这是继去年推出以来,O...早报# o3# OpenAI# 推理模型6个月前01400
Mistral发布首款推理模型Magistral,挑战Gemini 2.5 Pro与Claude Opus法国AI实验室 Mistral AI 正式发布了其首个推理模型家族——Magistral,标志着这家以开源著称的AI公司正式进军高阶推理领域。 该系列包括两个版本: Magistral Small(2...大语言模型# Magistral# Mistral AI# 推理模型6个月前01270
Homunculus-12B:在消费级显卡上运行的高效推理模型随着大语言模型不断向轻量化和高性能方向演进,Arcee Homunculus-12B 成为一个值得关注的新成员。它是一款基于 Qwen3-235B 蒸馏而来、部署在 Mistral-Nemo 架构上的...大语言模型# Homunculus-12B# 推理模型6个月前02650