阿里通义实验室开源 WebSailor,登顶 BrowseComp 榜单的网络智能体近日,阿里云通义实验室正式开源了一款名为 WebSailor 的新型网络智能体(Web Agent),它具备强大的多步推理与信息检索能力,在高难度网页导航任务中表现出色。 GitHub:https...大语言模型# WebSailor# 网络智能体# 阿里通义实验室5个月前02130
DeepSeek 推出 DeepSeek-Prover-V2:为 Lean 4 形式化定理证明设计的开源大语言模型DeepSeek于4月30日发布了 DeepSeek-Prover-V2,这是一个专门用于 Lean 4 形式化定理证明的开源大语言模型。该模型的设计目标是将非形式化的数学推理与形式化的证明构建整合到...大语言模型# DeepSeek# DeepSeek-Prover-V2# DeepSeek-Prover-V2-671B8个月前02120
德国科技咨询公司TNG发布全新 DeepSeek R1-0528 变体DeepSeek-TNG R1T2 Chimera,速度提升 200%距离中国 AI 初创公司 DeepSeek 发布其热门开源模型 DeepSeek-R1-0528 不到两个月,该模型因其低成本训练和高性能推理能力迅速风靡全球 AI 社区。 如今,这款强大模型已被广泛...大语言模型# DeepSeek-R1-0528# DeepSeek-TNG R1T2 Chimera# TNG6个月前02110
深度研究代理WebThinker:为大型推理模型提供深度研究能力中国人民大学、智源研究院和华为的研究人员推出一个深度研究代理WebThinker,旨在为大型推理模型(Large Reasoning Models, LRMs)提供深度研究能力。WebThinker ...大语言模型# WebThinker# 推理模型# 深度研究代理8个月前02070
微软推出Phi-4系列推理模型:Phi-4-reasoning、Phi-4-reasoning-plus和Phi-4-mini-reasoning一年前,微软推出了Phi-3,开启了小型语言模型(SLM)的新篇章。这些模型以其高效性和灵活性迅速吸引了广泛关注。如今,在 Phi 系列发布一周年之际,微软再次突破技术边界,推出了三款全新推理模型:P...大语言模型# Phi-4-mini-reasoning# Phi-4-reasoning# Phi-4-reasoning-plus8个月前02070
谷歌发布量化感知训练(QAT)优化版 Gemma 3 模型Gemma 3 QAT谷歌昨日(4月18日)通过官方博文发布了量化感知训练(QAT)优化版的Gemma 3模型。这一版本在保持高质量输出的同时,显著降低了对硬件内存的需求,为本地部署和普通硬件用户带来了福音。 MLX 版本...大语言模型# Gemma 3# Gemma 3 QAT# 谷歌8个月前02070
昆仑万维开源多模态思维链推理模型 Skywork R1V昆仑万维正式开源了首款工业界多模态思维链推理模型 Skywork R1V,成为中国第一个开源此类模型的企业。这一举措标志着昆仑万维在多模态 AI 领域的领先地位,并为全球开发者和研究人员提供了强大的工...大语言模型# Skywork R1V# 多模态思维链推理模型# 昆仑万维9个月前02060
InfoSeek:智源研究院提出可扩展的深度研究数据合成框架在大模型迈向“自主思考”的过程中,一个关键瓶颈逐渐显现: 现有基准任务太简单,无法真正测试模型的复杂推理能力。 Natural Questions、HotpotQA 等主流数据集虽然推动了多跳推理的发...大语言模型# InfoSeek# 深度研究3个月前02050
MiniMax发布全球首款开源大规模混合注意力推理模型MiniMax-M1近日,MiniMax 宣布推出全新大语言模型 MiniMax-M1,这是全球首款开源的大规模混合注意力推理模型,专为复杂任务和长上下文场景设计。 GitHub:https://github.com/M...大语言模型# MiniMax# MiniMax-M16个月前02050
英伟达发布数学推理模型 OpenMath-Nemotron 系列,基于Qwen2.5-32B训练长期以来,数学推理一直是人工智能领域的一项重大挑战。尽管传统的语言模型在生成自然语言文本方面表现出色,但在解决需要深入领域知识和多步骤逻辑推导的复杂数学问题时,它们往往显得力不从心。为了弥合这一差距...大语言模型# OpenMath-Nemotron# Qwen2.5-32B# 数学推理模型8个月前02040
Surya:NASA与IBM联合推出日球物理学AI基础模型,3.66亿参数开源可微调由NASA、IBM及合作伙伴联合开发的Surya,是全球首个面向日球物理学的开源AI基础模型。该模型拥有3.66亿参数,基于NASA太阳动力学天文台(SDO)9年的多仪器观测数据(约218TB)预训练...大语言模型# Surya# 日球物理学4个月前02030
Intelligent Internet 发布两款新型搜索推理模型:II-Search-4B 与 II-Search-CIR 4BIntelligent Internet(II)正式推出两款专注于信息检索与复杂推理的开源语言模型: II-Search-4B:面向多跳检索与事实验证的高效4B级模型 II-Search-CIR 4B...大语言模型# II-Search-4B# II-Search-CIR 4B# Intelligent Internet4个月前02010