DeepAgent:一种支持动态工具发现与记忆管理的通用推理代理中国人民大学与小红书联合推出 DeepAgent——一种端到端的深度推理代理框架。它能够在单一、连贯的推理过程中,自主完成思考、工具发现与行动执行,摆脱了传统代理(如 ReAct 框架)中“Reaso...大语言模型# DeepAgent2个月前0790
AI21 发布Jamba Reasoning 3B:30亿参数模型实现25万Token上下文,可在笔记本运行在小型语言模型(SLM)加速落地的趋势下,以色列AI公司 AI21 Labs 推出其最新力作——Jamba Reasoning 3B。 模型:https://huggingface.co/ai21la...大语言模型# AI21# Jamba Reasoning 3B2个月前0750
阿里通义千问上线 Qwen-3-Max-Preview:当前系列最强语言模型阿里Qwen项目组近日在官网及 OpenRouter 平台正式推出 Qwen-3-Max-Preview,并将其定义为通义千问系列中当前最强大的语言模型。 该模型基于 Qwen3 架构进一步优化,在推...大语言模型# Qwen-3-Max-Preview# 阿里3个月前0730
智谱发布 GLM-4.6:200K 上下文、30% 更省,专为编程优化今日,智谱 AI 正式推出其最新旗舰文本模型 GLM-4.6,作为 GLM 系列的最新迭代版本,该模型在推理、编码与智能体能力上实现全面升级,定位为当前国内最强的代码专用大模型。 项目主页:https...大语言模型# GLM-4.6# 智谱3个月前0710
IBM 发布 Granite 4.0:基于 Mamba-2/Transformer 混合架构的新一代高效开源大模型IBM 正式推出其最新开源语言模型系列 Granite 4.0,标志着企业在追求高性能与低推理成本之间的平衡上迈出关键一步。 这一代模型不再依赖传统的纯 Transformer 架构,而是采用创新的 ...大语言模型# Granite 4.0# IBM2个月前0610
推理能力再飞跃!Gemini 3正式发布:多模态拉满+代理编码,6.5亿用户可直接使用谷歌今天正式发布新一代旗舰大模型 Gemini 3,这是其继 Gemini 2.5 发布七个月后推出的重磅升级版本,也是迄今最强大的大语言模型。此次发布距离 OpenAI GPT-5.1、Anthro...大语言模型早报# Gemini 3# 谷歌1个月前0590
xAI 推出 Grok Code Fast 1:瞄准 GitHub Copilot,主打“快速且经济”的编程辅助埃隆·马斯克旗下的 xAI 正式发布代理式编码模型 Grok Code Fast 1,直接对标微软 GitHub Copilot 和 OpenAI Codex。这款基于全新架构构建的模型,以“速度快...大语言模型# Grok Code Fast 1# 编程辅助4个月前0590
DeepSeek V3.2正式发布:推理能力追平GPT-5,首个思考+工具调用开源模型经过两个多月测试,DeepSeek 正式推出 V3.2 系列模型,包括平衡型主力版本 DeepSeek V3.2 与极致推理增强版 DeepSeek V3.2 Speciale。前者以“推理能力不逊 ...大语言模型早报# DeepSeek V3.23周前0500
快手开源 KAT-Dev-72B-Exp:72B 参数代码模型,SWE-Bench 准确率达 74.6%快手 Kwaipilot 团队近日正式开源 KAT-Dev-72B-Exp ——一个专为软件工程任务设计的 720 亿参数开源大模型。该模型在权威代码修复基准 SWE-Bench Verified 上...大语言模型# KAT-Dev-72B-Exp# 快手2个月前0440
自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众学术研究的价值不仅在于成果本身,更在于被广泛知晓与合理应用。如今,同行评审研究数量持续激增,学者们愈发依赖社交平台发现前沿成果,而作者们也需投入大量精力推广研究,以维持学术可见度与引用率。 项目主页...大语言模型# AutoPR2个月前0380
月之暗面推出开源思维模型Kimi K2 Thinking,多项能力达SOTA水平月之暗面正式发布旗下迄今能力最强的开源思考模型——Kimi K2 Thinking。这款基于“模型即Agent”理念训练的新一代Thinking Agent,最核心的突破在于原生掌握“边思考,边使用工...大语言模型# Kimi K2 Thinking# 月之暗面1个月前0360
蚂蚁集团发布 Ling 2.0:基于“推理优先”原则的稀疏大模型家族蚂蚁集团 百灵大模型团队近日发布 Ling 2.0 —— 一个系统性构建的 稀疏混合专家(MoE)语言模型系列,核心理念是:模型容量可无限扩展,但每个 token 的计算成本应保持恒定。该系列通过统一...大语言模型# Ling 2.0# 蚂蚁集团1个月前0310