推理模型

排序

发布更新浏览点赞

OpenAI 推出o3 和 o4-mini：迄今最智能、最强大的模型，具备全面工具访问能力

今天，OpenAI发布 OpenAI o3 和 o4-mini，这是OpenAI o 系列模型的最新版本，经过训练能在回答前进行更长时间的思考。这些是OpenAI迄今发布的最智能模型，显著提升了 Ch...

大语言模型 # o3 # o4-mini # OpenAI

12个月前

05750

A-M-team推出32B密集语言模型AM-Thinking-v1：专注增强推理能力

A-M-team推出了AM-Thinking-v1，一款基于Qwen 2.5-32B-Base构建的32B密集语言模型，专注于提升推理能力。在推理基准测试中，AM-Thinking-v1表现出色，可媲...

大语言模型 # AM-Thinking-v1 # 推理模型

11个月前

05030

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里通义千问团队再次升级其 30B 级模型线，正式推出 Qwen3-30B-A3B-Thinking-2507。这并非一次简单迭代，而是针对复杂推理能力的深度优化版本。过去三个月中，项目组重点提升了...

大语言模型 # Qwen3-30B-A3B-Thinking-2507 # 推理模型

8个月前

04020

南加州大学推出一系列紧凑型推理模型Tina：利用LoRA技术实现低成本强化学习

在语言模型（LLM）领域，尽管通用任务性能取得了显著进展，但实现强大的多步推理能力仍然是一个重大挑战。这种能力对于复杂问题解决场景（如科学研究和战略规划）至关重要。然而，传统方法如监督微调（SFT）虽...

大语言模型 # Tina # v # 推理模型

11个月前

03860

360推出Light-R1-32B：通过SFT和DPO以低成本超越DeepSeek-R1-Distill-Qwen-32B

在数学竞赛 AIME24 上，尽管许多研究者尝试在 72B 或更小的模型上复现 DeepSeek-R1-Distill-Qwen-32B 的 72.6 分，但一直未能成功。模型集成模型推出日期 ...

大语言模型 # 360 # Light-R1-32B # 推理模型

1年前

03860

阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507：深度推理能力再升级

在持续三个月的优化后，阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升，进一步巩固了其在开源思维...

大语言模型 # Qwen3-235B-A22B-Thinking-2507 # 推理模型

8个月前

03420

MAI-DS-R1：微软团队基于DeepSeek-R1 推理模型进行后训练的版本

MAI-DS-R1 是一个由微软 AI 团队对 DeepSeek-R1 推理模型进行后训练的版本，提升其对受限话题的响应能力并改善其风险状况，同时保持推理能力和竞争力。简单来说就是把欧美的偏见加进去...

大语言模型 # DeepSeek-R1 # MAI-DS-R1 # 微软

12个月前

03280

Homunculus-12B：在消费级显卡上运行的高效推理模型

随着大语言模型不断向轻量化和高性能方向演进，Arcee Homunculus-12B 成为一个值得关注的新成员。它是一款基于 Qwen3-235B 蒸馏而来、部署在 Mistral-Nemo 架构上的...

大语言模型 # Homunculus-12B # 推理模型

10个月前

03200

卡内基梅隆大学推出 L1-1.5B：用强化学习优化 AI 推理过程，精准控制“思考”时长

推理语言模型通过生成更长的思维链序列来提升性能，但目前无法控制推理长度，导致计算资源分配低效。模型可能生成过长输出浪费资源，或过早停止导致性能不佳。传统方法（如使用“等待”或“最终答案”标记）会降低性...

大语言模型 # L1-1.5B # 卡内基梅隆大学 # 推理模型

1年前

03010

亚马逊计划推出「推理模型」，挑战 OpenAI 和 DeepSeek

据 Business Insider 报道，亚马逊正在开发自己的推理模型，以在 AI 市场中与 OpenAI、Anthropic 和 DeepSeek 等公司展开竞争。这一新模型将通过亚马逊的 AWS...

早报 # DeepSeek # OpenAI # 亚马逊

1年前

02880

Tessa-T1：专为 React 前端开发打造的推理模型

在前端开发领域，React 一直是构建现代 Web 应用的核心框架之一。然而，随着项目复杂度的增加，手动编写和优化 React 组件变得越来越耗时且容易出错。为了提升开发效率并简化前端工作流程，Tes...

大语言模型 # Qwen2.5-Coder # Tessa-T1 # 推理模型

1年前

02630

用推理模型评估模块化RAG：推理模型在核心检索任务中尚未超越传统RAG管道

在检索增强生成（RAG）系统中，kapa.ai一直在探索如何利用最新的技术提升系统的性能和适应性。最近，它们团队尝试将OpenAI的o3-mini推理模型融入RAG管道，希望借助其强大的推理能力优化信...

科普 # RAG # 推理模型 # 检索增强生成

1年前

02600

加载更多