推理模型

排序

发布更新浏览点赞

Mistral发布首款推理模型Magistral，挑战Gemini 2.5 Pro与Claude Opus

法国AI实验室 Mistral AI 正式发布了其首个推理模型家族——Magistral，标志着这家以开源著称的AI公司正式进军高阶推理领域。该系列包括两个版本： Magistral Small（2...

10个月前

01500

Homunculus-12B：在消费级显卡上运行的高效推理模型

随着大语言模型不断向轻量化和高性能方向演进，Arcee Homunculus-12B 成为一个值得关注的新成员。它是一款基于 Qwen3-235B 蒸馏而来、部署在 Mistral-Nemo 架构上的...

大语言模型 # Homunculus-12B # 推理模型

10个月前

03200

2025 年第一季度 AI 领域六大趋势：推理模型主导智能飞跃，中国AI加速崛起

近日，专注于 AI 模型与提供商分析的机构 Artificial Analysis 发布了《Artificial Analysis State of AI Q1 2025 Highlights Rep...

早报 # AI # 推理模型

10个月前

02250

A-M-team推出32B密集语言模型AM-Thinking-v1：专注增强推理能力

A-M-team推出了AM-Thinking-v1，一款基于Qwen 2.5-32B-Base构建的32B密集语言模型，专注于提升推理能力。在推理基准测试中，AM-Thinking-v1表现出色，可媲...

大语言模型 # AM-Thinking-v1 # 推理模型

11个月前

05030

深度研究代理WebThinker：为大型推理模型提供深度研究能力

中国人民大学、智源研究院和华为的研究人员推出一个深度研究代理WebThinker，旨在为大型推理模型（Large Reasoning Models, LRMs）提供深度研究能力。WebThinker ...

大语言模型 # WebThinker # 推理模型 # 深度研究代理

11个月前

02380

南加州大学推出一系列紧凑型推理模型Tina：利用LoRA技术实现低成本强化学习

在语言模型（LLM）领域，尽管通用任务性能取得了显著进展，但实现强大的多步推理能力仍然是一个重大挑战。这种能力对于复杂问题解决场景（如科学研究和战略规划）至关重要。然而，传统方法如监督微调（SFT）虽...

大语言模型 # Tina # v # 推理模型

11个月前

03860

MAI-DS-R1：微软团队基于DeepSeek-R1 推理模型进行后训练的版本

MAI-DS-R1 是一个由微软 AI 团队对 DeepSeek-R1 推理模型进行后训练的版本，提升其对受限话题的响应能力并改善其风险状况，同时保持推理能力和竞争力。简单来说就是把欧美的偏见加进去...

大语言模型 # DeepSeek-R1 # MAI-DS-R1 # 微软

12个月前

03280

OpenAI 推出o3 和 o4-mini：迄今最智能、最强大的模型，具备全面工具访问能力

今天，OpenAI发布 OpenAI o3 和 o4-mini，这是OpenAI o 系列模型的最新版本，经过训练能在回答前进行更长时间的思考。这些是OpenAI迄今发布的最智能模型，显著提升了 Ch...

大语言模型 # o3 # o4-mini # OpenAI

12个月前

05750

Tessa-T1：专为 React 前端开发打造的推理模型

在前端开发领域，React 一直是构建现代 Web 应用的核心框架之一。然而，随着项目复杂度的增加，手动编写和优化 React 组件变得越来越耗时且容易出错。为了提升开发效率并简化前端工作流程，Tes...

大语言模型 # Qwen2.5-Coder # Tessa-T1 # 推理模型

1年前

02630

谷歌发布了新推理模型Gemini 2.5系列：其特色在于回答问题前会进行“思考”过程

本周二（2025年3月25日），谷歌发布了新推理模型Gemini 2.5系列，其特色在于回答问题前会进行“思考”过程。为了启动这一系列，谷歌推出了Gemini 2.5 Pro Experimental...

大语言模型 # Gemini 2.5 # 思考模型 # 推理模型

1年前

01980

LG开源推理模型EXAONE Deep，在数学与编程方面表现出色

LG AI Research正式开源了其最新研发的AI推理模型——EXAONE Deep。这款模型分为2.4B、7.8B和32B三个版本，在多个关键领域展现出卓越性能。据官方称，EXAONE Deep...

大语言模型 # EXAONE Deep # LG # 推理模型

1年前

02100

卡内基梅隆大学推出 L1-1.5B：用强化学习优化 AI 推理过程，精准控制“思考”时长

推理语言模型通过生成更长的思维链序列来提升性能，但目前无法控制推理长度，导致计算资源分配低效。模型可能生成过长输出浪费资源，或过早停止导致性能不佳。传统方法（如使用“等待”或“最终答案”标记）会降低性...

大语言模型 # L1-1.5B # 卡内基梅隆大学 # 推理模型

1年前

03010

加载更多

Mistral发布首款推理模型Magistral，挑战Gemini 2.5 Pro与Claude Opus

Homunculus-12B：在消费级显卡上运行的高效推理模型

2025 年第一季度 AI 领域六大趋势：推理模型主导智能飞跃，中国AI加速崛起

A-M-team推出32B密集语言模型AM-Thinking-v1：专注增强推理能力

深度研究代理WebThinker：为大型推理模型提供深度研究能力

南加州大学推出一系列紧凑型推理模型Tina：利用LoRA技术实现低成本强化学习

MAI-DS-R1：微软团队基于DeepSeek-R1 推理模型进行后训练的版本

OpenAI 推出o3 和 o4-mini：迄今最智能、最强大的模型，具备全面工具访问能力

Tessa-T1：专为 React 前端开发打造的推理模型

谷歌发布了新推理模型Gemini 2.5系列：其特色在于回答问题前会进行“思考”过程

LG开源推理模型EXAONE Deep，在数学与编程方面表现出色

卡内基梅隆大学推出 L1-1.5B：用强化学习优化 AI 推理过程，精准控制“思考”时长

S.H.I.T

OpenMAIC

Alaya Code

抓虾吧

ITELLOU

Jellyfish AI短剧工厂

推理模型

网址

S.H.I.T

OpenMAIC

Alaya Code

抓虾吧

ITELLOU

Jellyfish AI短剧工厂