OpenAI 发布 GPT-5.1:8 种个性语调可选,Instant 更温暖、Thinking 更智能继8月GPT-5发布引发争议后,OpenAI今日正式推出旗舰模型更新版——GPT-5.1,通过双模型优化、8种个性语调预设、自适应推理等核心升级,旨在解决前代模型“体验平平”“缺乏个性化”的问题,让C...大语言模型# GPT-5.1# OpenAI1个月前0190
蚂蚁集团发布 Ling 2.0:基于“推理优先”原则的稀疏大模型家族蚂蚁集团 百灵大模型团队近日发布 Ling 2.0 —— 一个系统性构建的 稀疏混合专家(MoE)语言模型系列,核心理念是:模型容量可无限扩展,但每个 token 的计算成本应保持恒定。该系列通过统一...大语言模型# Ling 2.0# 蚂蚁集团1个月前0300
MiniMax 发布 MiniMax M2:面向编码与代理的高性能开源 MoE 模型MiniMax 团队正式发布 MiniMax M2 —— 一款专为代码生成与 AI 代理工作流优化的混合专家(Mixture-of-Experts, MoE)模型。该模型以 MIT 开源许可 在 Hu...大语言模型# MiniMax M21个月前0160
月之暗面推出开源思维模型Kimi K2 Thinking,多项能力达SOTA水平月之暗面正式发布旗下迄今能力最强的开源思考模型——Kimi K2 Thinking。这款基于“模型即Agent”理念训练的新一代Thinking Agent,最核心的突破在于原生掌握“边思考,边使用工...大语言模型# Kimi K2 Thinking# 月之暗面1个月前0320
DeepAgent:一种支持动态工具发现与记忆管理的通用推理代理中国人民大学与小红书联合推出 DeepAgent——一种端到端的深度推理代理框架。它能够在单一、连贯的推理过程中,自主完成思考、工具发现与行动执行,摆脱了传统代理(如 ReAct 框架)中“Reaso...大语言模型# DeepAgent1个月前0710
Cognition 发布 SWE-1.5:950 tok/s 高速编码模型,Windsurf 现已可用Cognition 正式推出软件工程专用模型家族新成员——SWE-1.5。作为一款拥有数千亿参数的前沿规模模型,它不仅实现了接近当前最佳水平(SOTA)的编程性能,更在速度上打破现有标准:通过与 Ce...大语言模型# Cognition# SWE-1.5# 编程模型1个月前01090
快手开源 KAT-Dev-72B-Exp:72B 参数代码模型,SWE-Bench 准确率达 74.6%快手 Kwaipilot 团队近日正式开源 KAT-Dev-72B-Exp ——一个专为软件工程任务设计的 720 亿参数开源大模型。该模型在权威代码修复基准 SWE-Bench Verified 上...大语言模型# KAT-Dev-72B-Exp# 快手2个月前0420
自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众学术研究的价值不仅在于成果本身,更在于被广泛知晓与合理应用。如今,同行评审研究数量持续激增,学者们愈发依赖社交平台发现前沿成果,而作者们也需投入大量精力推广研究,以维持学术可见度与引用率。 项目主页...大语言模型# AutoPR2个月前0360
Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是,在保持与Claude Sonnet 4相当编码性能的同时,将成本压缩...大语言模型# Anthropic# Claude Haiku 4.52个月前0840
AI21 发布Jamba Reasoning 3B:30亿参数模型实现25万Token上下文,可在笔记本运行在小型语言模型(SLM)加速落地的趋势下,以色列AI公司 AI21 Labs 推出其最新力作——Jamba Reasoning 3B。 模型:https://huggingface.co/ai21la...大语言模型# AI21# Jamba Reasoning 3B2个月前0750
三星研究员发布 TRM:700万参数小模型,在特定推理任务上超越大模型一个仅含 700万参数 的神经网络,如何在性能上匹敌甚至超过参数量高达其 10,000倍 的大语言模型? 这不是理论设想,而是现实。 三星先进技术研究院(SAIT)蒙特利尔分部的高级AI研究员 Ale...大语言模型# TRM# 三星# 小模型2个月前01280
蚂蚁集团发布万亿参数大模型 Ling-1T:开源最强非思考模型,推理效率超越 Gemini蚂蚁集团百灵大模型团队正式推出其新一代通用语言模型——Ling-1T。作为“百灵”Ling 2.0 系列的首款旗舰级非思考(non-thinking)模型,Ling-1T 拥有 总计1万亿参数,单次推...大语言模型# Ling-1T# 蚂蚁集团2个月前02770