Meta 发布MobileLLM-R1 系列模型:专为数学、编程(Python/C++)和科学推理任务设计Meta 正式发布 MobileLLM-R1 系列模型,包含 140M、360M 和 950M 三款尺寸,专为数学、编程(Python/C++)和科学推理任务设计。它不是通用聊天模型,而是一个经过精细...大语言模型# Meta# MobileLLM-R15个月前02590
蚂蚁集团推出推理模型 Ring-mini-2.0蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B,但每个输入 token 仅激活 14 亿个参数(非嵌入参数部分为 7.89 亿)。尽管 Ring-mini...大语言模型# Ring-mini-2.0# 推理模型# 蚂蚁集团5个月前01100
阿里Qwen团队发布Qwen3-Next-80B-A3B:用混合注意力 + 高稀疏MoE 实现极致性价比在大模型进入“长上下文”与“超大规模参数”竞争的新阶段,如何平衡性能、训练成本与推理效率,成为决定落地能力的关键。 为此,阿里通义千问(Qwen)项目组正式推出 Qwen3-Next ——一个全新设计...大语言模型# Qwen3-Next# Qwen3-Next-80B-A3B5个月前04840
百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking:原生支持函数调用,可联网查天气、调数据库百度推出ERNIE-4.5-21B-A3B-Thinking,一款专为复杂推理任务优化的轻量级 MoE(Mixture of Experts)大模型。该模型在原有 ERNIE-4.5 基础上显著提升了...大语言模型# ERNIE-4.5-21B-A3B-Thinking# 百度5个月前01410
SGP-Gen :用强化学习提升大模型生成 SVG 图像的能力由香港中文大学、西湖大学、上海人工智能实验室与马克斯·普朗克智能系统研究所联合开展的研究团队,近日推出 SGP-Gen ——一项探索大语言模型(LLM)在符号图形编程(Symbolic Graphic...大语言模型# SGP-Gen# SVG 图像5个月前01980
阿里通义千问上线 Qwen-3-Max-Preview:当前系列最强语言模型阿里Qwen项目组近日在官网及 OpenRouter 平台正式推出 Qwen-3-Max-Preview,并将其定义为通义千问系列中当前最强大的语言模型。 该模型基于 Qwen3 架构进一步优化,在推...大语言模型# Qwen-3-Max-Preview# 阿里5个月前0780
谷歌推出EmbeddingGemma:专为设备端设计的高性能开放嵌入模型在构建轻量级、隐私优先的 AI 应用时,如何在资源受限的设备上实现高质量语义理解,是一大挑战。传统的嵌入模型往往依赖云端计算,带来延迟、隐私和离线可用性问题。 为此,谷歌推出 EmbeddingGem...大语言模型# EmbeddingGemma# 嵌入模型# 谷歌5个月前01830
Instinct:由 Continue 打造的全球首个开放 Next Edit 模型在代码编辑中,真正消耗时间的往往不是“写代码”,而是重构、调整、维护与迭代。传统自动补全工具只能在光标处插入文本,面对复杂的多行修改仍需手动操作,打断开发节奏。 为此,开发工具团队 Continue ...大语言模型# Continue# Instinct# Next Edit 模型5个月前01750
月之暗面发布 Kimi K2 新版本(0905):编程能力再升级,支持 256K 上下文与高速 API月之暗面宣布推出其旗舰模型 Kimi K2 的最新版本(0905),重点针对真实编程任务进行优化,在代码生成能力、上下文处理、API 性能和平台兼容性等方面实现多项重要升级。 此次更新聚焦于提升模型在...大语言模型# Kimi K2# Kimi-K2-Instruct-0905# 月之暗面5个月前01770
字节跳动发布UI-TARS-2:一个面向真实GUI交互的原生代理模型在图形用户界面(GUI)日益复杂的背景下,如何让AI代理像人类一样流畅操作系统、完成多步骤任务,是自动化与智能体研究的重要方向。然而,当前自主GUI代理的发展仍面临诸多挑战:训练数据难以规模化获取、多...大语言模型# UI-TARS-25个月前01480
大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件语言模型正在越来越多地承担需要世界知识的任务:回答问题、生成事实性文本、辅助决策……但一个根本性问题仍未解决: 模型是如何从训练数据中“学会”知识的? 我们训练模型时喂的是文本,但它输出的却是“信念...大语言模型# LMEnt# 大语言模型5个月前01390
InfoSeek:智源研究院提出可扩展的深度研究数据合成框架在大模型迈向“自主思考”的过程中,一个关键瓶颈逐渐显现: 现有基准任务太简单,无法真正测试模型的复杂推理能力。 Natural Questions、HotpotQA 等主流数据集虽然推动了多跳推理的发...大语言模型# InfoSeek# 深度研究5个月前02240