推理模型

排序

发布更新浏览点赞

Nanbeige4.1-3B：在保持小参数规模的同时，实现强大推理、偏好对齐与高效智能体能力

Nanbeige4.1-3B 基于 Nanbeige4-3B-Base 架构构建，是Nanbeige团队此前推出的推理专用模型 Nanbeige4-3B-Thinking-2511 的全面增强迭代版本...

大语言模型 # Nanbeige4.1-3B # 推理模型

2个月前

0510

阿里通义实验室推出新一代旗舰推理模型Qwen3-Max-Thinking：支持自适应工具调用，性能对标 GPT-5.2

阿里通义实验室正式发布 Qwen3-Max-Thinking，作为 Qwen 系列的最新旗舰推理模型。通过显著扩大参数规模并投入大量强化学习训练算力，该模型在事实准确性、复杂推理、指令遵循、人类偏好对...

大语言模型 # Qwen3-Max-Thinking # 推理模型

2个月前

0670

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

美团 LongCat 团队正式推出 LongCat-Flash-Thinking——一款专注于高复杂度任务推理的大型语言模型（LRM）。该模型在保持前代 LongCat-Flash-Chat 高效响应...

大语言模型 # LongCat-Flash-Thinking # 推理模型 # 美团

6个月前

01910

FastMTP：通过增强多令牌预测提升大模型推理效率

在大语言模型（LLM）的实际应用中，推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升，但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码（Speculative Dec...

大语言模型 # FastMTP # 推理模型

6个月前

01980

蚂蚁集团推出推理模型 Ring-mini-2.0

蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B，但每个输入 token 仅激活 14 亿个参数（非嵌入参数部分为 7.89 亿）。尽管 Ring-mini...

大语言模型 # Ring-mini-2.0 # 推理模型 # 蚂蚁集团

7个月前

01380

3D-R1：让大模型真正理解三维空间的统一推理模型

上海工程技术大学与北京大学计算机学院联合提出一个开源通用模型 3D-R1，旨在提升3D视觉-语言模型（3D Vision-Language Models, 3D-VLMs）在复杂场景中的推理能力，推动...

3D模型 # 3D-R1 # 推理模型

8个月前

01350

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里通义千问团队再次升级其 30B 级模型线，正式推出 Qwen3-30B-A3B-Thinking-2507。这并非一次简单迭代，而是针对复杂推理能力的深度优化版本。过去三个月中，项目组重点提升了...

大语言模型 # Qwen3-30B-A3B-Thinking-2507 # 推理模型

8个月前

04020

阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507：深度推理能力再升级

在持续三个月的优化后，阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升，进一步巩固了其在开源思维...

大语言模型 # Qwen3-235B-A22B-Thinking-2507 # 推理模型

8个月前

03420

月之暗面开源智能代理基础模型Kimi K2，参数达 1T，激活参数 32B

月之暗面正式发布其新一代 MoE 架构大模型——Kimi K2，并同步开源。该模型具备卓越的代码能力、数学推理能力以及智能代理（Agent）任务处理能力，是目前最适配于构建自主化智能系统的开源基础模型...

大语言模型 # Kimi K2 # 推理模型 # 智能代理模型

9个月前

01340

Reka AI发布推理模型Reka Flash 3.1 ：强化学习驱动的高效推理模型升级

Reka AI 正式发布了其推理模型 Reka Flash 3.1，这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出，并作为 Re...

大语言模型 # Reka AI # Reka Flash 3.1 # 推理模型

9个月前

01780

驳“大型推理模型不是真正的智能模型”：Claude Opus第一作者发文指出苹果论文实验设计局限

近日，Anthropic 研究团队在一篇新发布的论文中，对苹果公司 Shojaee 等人（2025）提出的观点进行了系统性反驳。该观点认为：大型推理模型（LRMs）在复杂规划任务中表现出“准确性崩溃...

早报 # Claude Opus # 推理模型 # 苹果

10个月前

02300

开发者喜讯！OpenAI 宣布最强推理模型 o3 价格下调 80%

OpenAI今天宣布对其旗舰推理大模型 o3 进行史无前例的价格下调——输入和输出 Token 成本均降低 80%！这项决定不仅让开发者拍手叫好，也让整个 AI 行业为之震动。这是继去年推出以来，O...

早报 # o3 # OpenAI # 推理模型

10个月前

01640

加载更多

Nanbeige4.1-3B：在保持小参数规模的同时，实现强大推理、偏好对齐与高效智能体能力

阿里通义实验室推出新一代旗舰推理模型Qwen3-Max-Thinking：支持自适应工具调用，性能对标 GPT-5.2

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

FastMTP：通过增强多令牌预测提升大模型推理效率

蚂蚁集团推出推理模型 Ring-mini-2.0

3D-R1：让大模型真正理解三维空间的统一推理模型

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507：深度推理能力再升级

月之暗面开源智能代理基础模型Kimi K2，参数达 1T，激活参数 32B

Reka AI发布推理模型Reka Flash 3.1 ：强化学习驱动的高效推理模型升级

驳“大型推理模型不是真正的智能模型”：Claude Opus第一作者发文指出苹果论文实验设计局限

开发者喜讯！OpenAI 宣布最强推理模型 o3 价格下调 80%

S.H.I.T

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂

Alaya Code

推理模型

网址

S.H.I.T

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂

Alaya Code