字节跳动 & 南大联合推出 CriticLean 框架:让 AI 更准确地翻译数学为代码将自然语言数学语句自动转化为形式化代码(如 Lean 4)是计算数学中的核心挑战之一。尽管已有许多自动化工具尝试解决这一问题,但其准确性仍面临瓶颈,尤其是在需要深入理解语义的复杂场景中。 为此,字节跳...大语言模型# CriticLean# 字节跳动5个月前01600
微软推出 NextCoder:基于 Qwen2.5-Coder 的高效代码编辑模型近年来,软件开发中的代码编辑需求日益增长,尤其是在维护和重构已有项目时。然而,现有的大语言模型在面对多样化的代码修改任务时,往往表现不佳。为了解决这一问题,微软联合相关研究团队提出了一套全新的方法,并...大语言模型# NextCoder# Qwen2.5-Coder# 代码编辑模型5个月前02140
Hugging Face发布SmolLM3:3B 级全能小模型,支持推理/非推理双模式与 128k 上下文随着边缘计算和本地部署需求的增长,小型语言模型(Small Language Model, SLM) 正在成为新一代 AI 应用的关键组成部分。近日,Hugging Face 推出了其最新力作 —— ...大语言模型# Hugging Face# SmolLM3# 小模型5个月前0960
Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B:实现 93% 准确率,无需昂贵微调在 LLM(大语言模型)应用场景日益复杂的背景下,如何将用户查询智能路由到最合适的模型,成为提升效率和体验的关键挑战。 近日,Katanemo Labs 推出了一个创新的解决方案 —— Arch-Ro...大语言模型# Arch-Router-1.5B# 路由模型5个月前01230
阿里通义实验室开源 WebSailor,登顶 BrowseComp 榜单的网络智能体近日,阿里云通义实验室正式开源了一款名为 WebSailor 的新型网络智能体(Web Agent),它具备强大的多步推理与信息检索能力,在高难度网页导航任务中表现出色。 GitHub:https...大语言模型# WebSailor# 网络智能体# 阿里通义实验室5个月前02130
MemOS:为大语言模型设计的长期记忆操作系统MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型(LLMs)设计的长期记忆操作系统。 项目主页:https...大语言模型# MemOS# 大语言模型5个月前03810
华为正式开源盘古大模型与昇腾推理技术周一,华为宣布一项重大举措:开源其盘古70亿参数(7B)密集模型和720亿参数(72B)Pro MoE混合专家模型,以及基于昇腾平台的高效推理技术。 这一动作被视为华为持续推进大型AI模型研究与产业应...大语言模型# 华为# 盘古大模型5个月前01840
Sakana AI 推出 AB-MCTS:让多个前沿模型协作解决复杂推理问题Sakana AI 发布了一项令人瞩目的研究成果:他们开发出一种名为 AB-MCTS(自适应分支蒙特卡洛树搜索) 的新算法。该算法在 ARC-AGI-2 基准测试中表现出色,显著优于单独使用 o4-m...大语言模型# AB-MCTS# Sakana AI5个月前02480
Kurma AI专为水产养殖领域打造的通用语言模型AQUA-7B和AQUA-1B:以生成式 AI 重塑美国水产养殖业美国拥有广阔的海岸线、纯净的水域资源以及领先的技术基础,具备发展高产、可持续水产养殖业的天然优势。然而,这一潜力远未被充分挖掘。 据2021年数据显示,美国人均海产品消费量已达约 20.5磅,其中 8...大语言模型# AQUA-1B# AQUA-7B# Kurma AI5个月前02640
德国科技咨询公司TNG发布全新 DeepSeek R1-0528 变体DeepSeek-TNG R1T2 Chimera,速度提升 200%距离中国 AI 初创公司 DeepSeek 发布其热门开源模型 DeepSeek-R1-0528 不到两个月,该模型因其低成本训练和高性能推理能力迅速风靡全球 AI 社区。 如今,这款强大模型已被广泛...大语言模型# DeepSeek-R1-0528# DeepSeek-TNG R1T2 Chimera# TNG5个月前02110
苹果 & 香港研究人员推出 DiffuCoder:首个面向代码生成的扩散大语言模型近日,苹果与香港的研究团队联合提出了一种全新的基于扩散机制的大语言模型(Diffusion Large Language Model, dLLM)——DiffuCoder,专为代码生成任务设计。 Gi...大语言模型# DiffuCoder# 扩散大语言模型# 苹果5个月前01850
百度开源 ERNIE 4.5:覆盖 0.3B 到 424B 参数的大型语言模型系列百度正式开源了其最新的 ERNIE 4.5 系列,这是继 ERNIE 系列之后又一重磅发布的基础语言模型家族。该系列包含 10 款不同规模与架构的模型,从仅 0.3B(十亿)参数的小型密集模型 到高达...大语言模型# ERNIE 4.5# 百度5个月前02130