深度研究代理WebThinker:为大型推理模型提供深度研究能力中国人民大学、智源研究院和华为的研究人员推出一个深度研究代理WebThinker,旨在为大型推理模型(Large Reasoning Models, LRMs)提供深度研究能力。WebThinker ...大语言模型# WebThinker# 推理模型# 深度研究代理7个月前02050
驳“大型推理模型不是真正的智能模型”:Claude Opus第一作者发文指出苹果论文实验设计局限近日,Anthropic 研究团队在一篇新发布的论文中,对苹果公司 Shojaee 等人(2025)提出的观点进行了系统性反驳。该观点认为:大型推理模型(LRMs)在复杂规划任务中表现出“准确性崩溃...早报# Claude Opus# 推理模型# 苹果6个月前02020
LG开源推理模型EXAONE Deep,在数学与编程方面表现出色LG AI Research正式开源了其最新研发的AI推理模型——EXAONE Deep。这款模型分为2.4B、7.8B和32B三个版本,在多个关键领域展现出卓越性能。据官方称,EXAONE Deep...大语言模型# EXAONE Deep# LG# 推理模型9个月前01980
谷歌发布了新推理模型Gemini 2.5系列:其特色在于回答问题前会进行“思考”过程本周二(2025年3月25日),谷歌发布了新推理模型Gemini 2.5系列,其特色在于回答问题前会进行“思考”过程。为了启动这一系列,谷歌推出了Gemini 2.5 Pro Experimental...大语言模型# Gemini 2.5# 思考模型# 推理模型9个月前01890
阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507:深度推理能力再升级在持续三个月的优化后,阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升,进一步巩固了其在开源思维...大语言模型# Qwen3-235B-A22B-Thinking-2507# 推理模型4个月前01850
开发者喜讯!OpenAI 宣布最强推理模型 o3 价格下调 80%OpenAI今天宣布对其旗舰推理大模型 o3 进行史无前例的价格下调——输入和输出 Token 成本均降低 80%!这项决定不仅让开发者拍手叫好,也让整个 AI 行业为之震动。 这是继去年推出以来,O...早报# o3# OpenAI# 推理模型6个月前01400
美团 LongCat 团队发布 LongCat-Flash-Thinking:具备形式化与智能体推理能力的新一代高效推理模型美团 LongCat 团队正式推出 LongCat-Flash-Thinking——一款专注于高复杂度任务推理的大型语言模型(LRM)。该模型在保持前代 LongCat-Flash-Chat 高效响应...大语言模型# LongCat-Flash-Thinking# 推理模型# 美团3个月前01370
Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级Reka AI 正式发布了其推理模型 Reka Flash 3.1,这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出,并作为 Re...大语言模型# Reka AI# Reka Flash 3.1# 推理模型5个月前01360
FastMTP:通过增强多令牌预测提升大模型推理效率在大语言模型(LLM)的实际应用中,推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升,但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码(Speculative Dec...大语言模型# FastMTP# 推理模型3个月前01300
3D-R1:让大模型真正理解三维空间的统一推理模型上海工程技术大学与北京大学计算机学院联合提出一个开源通用模型 3D-R1,旨在提升3D视觉-语言模型(3D Vision-Language Models, 3D-VLMs)在复杂场景中的推理能力,推动...3D模型# 3D-R1# 推理模型4个月前01280
Mistral发布首款推理模型Magistral,挑战Gemini 2.5 Pro与Claude Opus法国AI实验室 Mistral AI 正式发布了其首个推理模型家族——Magistral,标志着这家以开源著称的AI公司正式进军高阶推理领域。 该系列包括两个版本: Magistral Small(2...大语言模型# Magistral# Mistral AI# 推理模型6个月前01270
月之暗面开源智能代理基础模型Kimi K2,参数达 1T,激活参数 32B月之暗面正式发布其新一代 MoE 架构大模型——Kimi K2,并同步开源。该模型具备卓越的代码能力、数学推理能力以及智能代理(Agent)任务处理能力,是目前最适配于构建自主化智能系统的开源基础模型...大语言模型# Kimi K2# 推理模型# 智能代理模型5个月前01210