推理能力再飞跃!Gemini 3正式发布:多模态拉满+代理编码,6.5亿用户可直接使用谷歌今天正式发布新一代旗舰大模型 Gemini 3,这是其继 Gemini 2.5 发布七个月后推出的重磅升级版本,也是迄今最强大的大语言模型。此次发布距离 OpenAI GPT-5.1、Anthro...大语言模型早报# Gemini 3# 谷歌2个月前0670
IBM 发布 Granite 4.0 Nano:350M-1.5B 参数边缘模型,混合SSM架构+Apache 2.0开源,性能超越同尺寸竞品在边缘计算与设备端AI需求日益增长的今天,“小模型能否实现强能力”成为行业核心诉求。近日,IBM 正式推出 Granite 4.0 Nano 系列模型——作为 Granite 4.0 家族的全新成员...大语言模型# Granite 4.0 Nano# IBM2个月前0170
OpenAI 开源安全推理模型gpt-oss-safeguard:自定义策略+可解释推理,多策略准确率超越 GPT-5-thinking在AI内容安全领域,传统分类器“依赖标注样本、策略更新繁琐”的痛点长期困扰开发者。OpenAI 正式发布 gpt-oss-safeguard 研究预览版——一款开源权重的安全推理模型,以“自定义策略...大语言模型# gpt-oss-safeguard# OpenAI2个月前0120
OpenAI 发布 GPT-5.1:8 种个性语调可选,Instant 更温暖、Thinking 更智能继8月GPT-5发布引发争议后,OpenAI今日正式推出旗舰模型更新版——GPT-5.1,通过双模型优化、8种个性语调预设、自适应推理等核心升级,旨在解决前代模型“体验平平”“缺乏个性化”的问题,让C...大语言模型# GPT-5.1# OpenAI3个月前01030
蚂蚁集团发布 Ling 2.0:基于“推理优先”原则的稀疏大模型家族蚂蚁集团 百灵大模型团队近日发布 Ling 2.0 —— 一个系统性构建的 稀疏混合专家(MoE)语言模型系列,核心理念是:模型容量可无限扩展,但每个 token 的计算成本应保持恒定。该系列通过统一...大语言模型# Ling 2.0# 蚂蚁集团3个月前0390
MiniMax 发布 MiniMax M2:面向编码与代理的高性能开源 MoE 模型MiniMax 团队正式发布 MiniMax M2 —— 一款专为代码生成与 AI 代理工作流优化的混合专家(Mixture-of-Experts, MoE)模型。该模型以 MIT 开源许可 在 Hu...大语言模型# MiniMax M23个月前0280
月之暗面推出开源思维模型Kimi K2 Thinking,多项能力达SOTA水平月之暗面正式发布旗下迄今能力最强的开源思考模型——Kimi K2 Thinking。这款基于“模型即Agent”理念训练的新一代Thinking Agent,最核心的突破在于原生掌握“边思考,边使用工...大语言模型# Kimi K2 Thinking# 月之暗面3个月前0480
DeepAgent:一种支持动态工具发现与记忆管理的通用推理代理中国人民大学与小红书联合推出 DeepAgent——一种端到端的深度推理代理框架。它能够在单一、连贯的推理过程中,自主完成思考、工具发现与行动执行,摆脱了传统代理(如 ReAct 框架)中“Reaso...大语言模型# DeepAgent3个月前01330
Cognition 发布 SWE-1.5:950 tok/s 高速编码模型,Windsurf 现已可用Cognition 正式推出软件工程专用模型家族新成员——SWE-1.5。作为一款拥有数千亿参数的前沿规模模型,它不仅实现了接近当前最佳水平(SOTA)的编程性能,更在速度上打破现有标准:通过与 Ce...大语言模型# Cognition# SWE-1.5# 编程模型3个月前01510
快手开源 KAT-Dev-72B-Exp:72B 参数代码模型,SWE-Bench 准确率达 74.6%快手 Kwaipilot 团队近日正式开源 KAT-Dev-72B-Exp ——一个专为软件工程任务设计的 720 亿参数开源大模型。该模型在权威代码修复基准 SWE-Bench Verified 上...大语言模型# KAT-Dev-72B-Exp# 快手3个月前0480
自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众学术研究的价值不仅在于成果本身,更在于被广泛知晓与合理应用。如今,同行评审研究数量持续激增,学者们愈发依赖社交平台发现前沿成果,而作者们也需投入大量精力推广研究,以维持学术可见度与引用率。 项目主页...大语言模型# AutoPR3个月前0420
Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是,在保持与Claude Sonnet 4相当编码性能的同时,将成本压缩...大语言模型# Anthropic# Claude Haiku 4.54个月前01030