新OpenAI正式发布GPT-5.2 :GDPval 超人类专家,编码/长上下文/视觉能力全面跃升OpenAI 再度刷新大模型天花板——GPT-5.2 正式发布。这款专为专业知识工作和长期运行智能体打造的前沿模型,在编码、长上下文推理、视觉理解、工具调用等核心能力上实现跨越式提升,甚至在覆盖 44...大语言模型早报# GPT-5.2# OpenAI2天前0120
Mistral AI 发布 Devstral 2 编程模型+Vibe CLI:1230亿参数适配智能体开发,终端原生编程更高效Mistral AI 推出两大核心产品——新一代软件工程智能体编程模型家族 Devstral 2,以及开源命令行编程助手 Mistral Vibe CLI。前者以高参数、长上下文和高性价比成为开源编程...大语言模型# Devstral 2# Mistral AI# 编程模型4天前050
腾讯发布混元 2.0 大模型:406B MoE 架构,256K 上下文,推理效率国内领先腾讯正式发布自研大模型 混元 2.0(Tencent HY 2.0),包含 HY 2.0 Think(推理优化版)与 HY 2.0 Instruct(指令对齐版)两个版本。该模型采用 混合专家(MoE...大语言模型# 混元 2.0 大模型# 腾讯1周前0160
亚马逊推出全新Nova模型系列及开创性服务:Nova Forge与Nova Act核心要点 Nova 2 模型系列在推理、多模态处理、对话式AI、代码生成及智能体任务方面提供业界领先的性价比。 Nova Forge 服务允许企业通过其独特的“开放训练”方法,在训练早期融入专有数据...大语言模型# NOVA# Nova Act# Nova Forge2周前0110
DeepSeek V3.2正式发布:推理能力追平GPT-5,首个思考+工具调用开源模型经过两个多月测试,DeepSeek 正式推出 V3.2 系列模型,包括平衡型主力版本 DeepSeek V3.2 与极致推理增强版 DeepSeek V3.2 Speciale。前者以“推理能力不逊 ...大语言模型早报# DeepSeek V3.22周前0440
685B参数DeepSeekMath-V2开源!IMO/CMO金牌+Putnam近满分,颠覆数学推理范式数学推理领域迎来里程碑式突破!DeepSeek AI 正式发布开源数学模型 DeepSeekMath-V2,这款基于 685B 参数专家混合(MoE)架构的模型,不仅在 IMO 2025、CMO 20...大语言模型# DeepSeek# DeepSeekMath-V2# 深度求索2周前0110
微软推出Fara - 7B模型:70亿参数本地运行,专为计算机使用代理 (CUA) 设计的小型语言模型微软正式推出首款专为计算机使用代理(CUA)设计的小型语言模型Fara - 7B。这款仅70亿参数的模型跳出了对大规模云端模型的依赖,凭借可本地运行的特性,在降低延迟的同时筑牢数据隐私防线,更以独特的...大语言模型# Fara - 7B# 微软# 计算机使用代理3周前0100
Anthropic 发布 Claude Opus 4.5:宣称全球最佳编程模型,API 降价+多平台同步上线Anthropic 今日正式发布旗舰级 AI 模型 Claude Opus 4.5,聚焦编程、代理任务与计算机使用场景,凭借多项核心突破重塑行业标杆。该模型不仅在 SWE-bench Verified...大语言模型# Anthropic# Claude Opus 4.5# 编程模型3周前080
艾伦AI研究所发布Olmo 3系列模型:完全开放的推理模型,训练数据与中间步骤全透明在开源AI领域,“开放”往往局限于最终模型权重的分享,而模型训练的数据、流程、中间检查点等核心环节仍处于“黑箱”状态。Ai2(艾伦人工智能研究所)最新发布的 Olmo 3 系列模型,彻底打破了这一现状...大语言模型# Olmo 3# 艾伦AI研究所3周前01270
推理能力再飞跃!Gemini 3正式发布:多模态拉满+代理编码,6.5亿用户可直接使用谷歌今天正式发布新一代旗舰大模型 Gemini 3,这是其继 Gemini 2.5 发布七个月后推出的重磅升级版本,也是迄今最强大的大语言模型。此次发布距离 OpenAI GPT-5.1、Anthro...大语言模型早报# Gemini 3# 谷歌4周前0540
IBM 发布 Granite 4.0 Nano:350M-1.5B 参数边缘模型,混合SSM架构+Apache 2.0开源,性能超越同尺寸竞品在边缘计算与设备端AI需求日益增长的今天,“小模型能否实现强能力”成为行业核心诉求。近日,IBM 正式推出 Granite 4.0 Nano 系列模型——作为 Granite 4.0 家族的全新成员...大语言模型# Granite 4.0 Nano# IBM4周前050
OpenAI 开源安全推理模型gpt-oss-safeguard:自定义策略+可解释推理,多策略准确率超越 GPT-5-thinking在AI内容安全领域,传统分类器“依赖标注样本、策略更新繁琐”的痛点长期困扰开发者。OpenAI 正式发布 gpt-oss-safeguard 研究预览版——一款开源权重的安全推理模型,以“自定义策略...大语言模型# gpt-oss-safeguard# OpenAI4周前050