推理模型

排序

发布更新浏览点赞

深度研究代理WebThinker：为大型推理模型提供深度研究能力

中国人民大学、智源研究院和华为的研究人员推出一个深度研究代理WebThinker，旨在为大型推理模型（Large Reasoning Models, LRMs）提供深度研究能力。WebThinker ...

11个月前

02380

驳“大型推理模型不是真正的智能模型”：Claude Opus第一作者发文指出苹果论文实验设计局限

近日，Anthropic 研究团队在一篇新发布的论文中，对苹果公司 Shojaee 等人（2025）提出的观点进行了系统性反驳。该观点认为：大型推理模型（LRMs）在复杂规划任务中表现出“准确性崩溃...

早报 # Claude Opus # 推理模型 # 苹果

10个月前

02300

2025 年第一季度 AI 领域六大趋势：推理模型主导智能飞跃，中国AI加速崛起

近日，专注于 AI 模型与提供商分析的机构 Artificial Analysis 发布了《Artificial Analysis State of AI Q1 2025 Highlights Rep...

早报 # AI # 推理模型

10个月前

02250

LG开源推理模型EXAONE Deep，在数学与编程方面表现出色

LG AI Research正式开源了其最新研发的AI推理模型——EXAONE Deep。这款模型分为2.4B、7.8B和32B三个版本，在多个关键领域展现出卓越性能。据官方称，EXAONE Deep...

大语言模型 # EXAONE Deep # LG # 推理模型

1年前

02100

FastMTP：通过增强多令牌预测提升大模型推理效率

在大语言模型（LLM）的实际应用中，推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升，但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码（Speculative Dec...

大语言模型 # FastMTP # 推理模型

6个月前

01980

谷歌发布了新推理模型Gemini 2.5系列：其特色在于回答问题前会进行“思考”过程

本周二（2025年3月25日），谷歌发布了新推理模型Gemini 2.5系列，其特色在于回答问题前会进行“思考”过程。为了启动这一系列，谷歌推出了Gemini 2.5 Pro Experimental...

大语言模型 # Gemini 2.5 # 思考模型 # 推理模型

1年前

01980

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

美团 LongCat 团队正式推出 LongCat-Flash-Thinking——一款专注于高复杂度任务推理的大型语言模型（LRM）。该模型在保持前代 LongCat-Flash-Chat 高效响应...

大语言模型 # LongCat-Flash-Thinking # 推理模型 # 美团

6个月前

01910

Reka AI发布推理模型Reka Flash 3.1 ：强化学习驱动的高效推理模型升级

Reka AI 正式发布了其推理模型 Reka Flash 3.1，这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出，并作为 Re...

大语言模型 # Reka AI # Reka Flash 3.1 # 推理模型

9个月前

01780

开发者喜讯！OpenAI 宣布最强推理模型 o3 价格下调 80%

OpenAI今天宣布对其旗舰推理大模型 o3 进行史无前例的价格下调——输入和输出 Token 成本均降低 80%！这项决定不仅让开发者拍手叫好，也让整个 AI 行业为之震动。这是继去年推出以来，O...

早报 # o3 # OpenAI # 推理模型

10个月前

01640

Mistral发布首款推理模型Magistral，挑战Gemini 2.5 Pro与Claude Opus

法国AI实验室 Mistral AI 正式发布了其首个推理模型家族——Magistral，标志着这家以开源著称的AI公司正式进军高阶推理领域。该系列包括两个版本： Magistral Small（2...

大语言模型 # Magistral # Mistral AI # 推理模型

10个月前

01500

蚂蚁集团推出推理模型 Ring-mini-2.0

蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B，但每个输入 token 仅激活 14 亿个参数（非嵌入参数部分为 7.89 亿）。尽管 Ring-mini...

大语言模型 # Ring-mini-2.0 # 推理模型 # 蚂蚁集团

7个月前

01380

3D-R1：让大模型真正理解三维空间的统一推理模型

上海工程技术大学与北京大学计算机学院联合提出一个开源通用模型 3D-R1，旨在提升3D视觉-语言模型（3D Vision-Language Models, 3D-VLMs）在复杂场景中的推理能力，推动...

3D模型 # 3D-R1 # 推理模型

8个月前

01350

加载更多

深度研究代理WebThinker：为大型推理模型提供深度研究能力

驳“大型推理模型不是真正的智能模型”：Claude Opus第一作者发文指出苹果论文实验设计局限

2025 年第一季度 AI 领域六大趋势：推理模型主导智能飞跃，中国AI加速崛起

LG开源推理模型EXAONE Deep，在数学与编程方面表现出色

FastMTP：通过增强多令牌预测提升大模型推理效率

谷歌发布了新推理模型Gemini 2.5系列：其特色在于回答问题前会进行“思考”过程

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

Reka AI发布推理模型Reka Flash 3.1 ：强化学习驱动的高效推理模型升级

开发者喜讯！OpenAI 宣布最强推理模型 o3 价格下调 80%

Mistral发布首款推理模型Magistral，挑战Gemini 2.5 Pro与Claude Opus

蚂蚁集团推出推理模型 Ring-mini-2.0

3D-R1：让大模型真正理解三维空间的统一推理模型

S.H.I.T

OpenMAIC

Alaya Code

ITELLOU

抓虾吧

Jellyfish AI短剧工厂

推理模型

网址

S.H.I.T

OpenMAIC

Alaya Code

ITELLOU

抓虾吧

Jellyfish AI短剧工厂