蚂蚁集团 inclusionAI 团队推出Ring-2.5-1T:全球首个万亿参数混合线性注意力思维模型蚂蚁集团 inclusionAI 团队正式推出 Ring-2.5-1T,这是全球首个基于混合线性注意力架构的开源万亿参数思维模型,标志着向通用人工智能体迈出关键一步。 Hugging Face :ht...大语言模型# Ring-2.5-1T# 蚂蚁集团2周前0100
Nanbeige4.1-3B:在保持小参数规模的同时,实现强大推理、偏好对齐与高效智能体能力Nanbeige4.1-3B 基于 Nanbeige4-3B-Base 架构构建,是Nanbeige团队此前推出的推理专用模型 Nanbeige4-3B-Thinking-2511 的全面增强迭代版本...大语言模型# Nanbeige4.1-3B# 推理模型2周前0260
MiniMax正式发布MiniMax M2.5 :更快、更强、更智能,专为现实生产力打造今天,MiniMax 正式推出全新一代大模型——MiniMax M2.5。这款模型依托在数十万个复杂真实世界环境中开展的大规模强化学习训练,实现了能力的全面升级。 在编程开发、智能体工具使用与信息搜索...大语言模型早报# MiniMax# MiniMax M2.52周前02310
智谱AI正式发布GLM-5:744B参数+28.5T数据,长周期智能体能力登顶开源第一智谱AI正式推出新一代通用大模型——GLM-5,这款模型在设计之初就明确了核心定位:面向复杂系统工程和长周期智能体任务,致力于打破基础模型“只能聊天、难以落地”的局限,实现从“氛围编程”到“智能体工程...大语言模型# GLM-5# 智谱AI2周前0280
Cursor 发布 Composer 1.5:强化学习提升 20 倍,支持复杂代码推理Cursor 团队近日正式推出其智能编程模型 Composer 1.5,作为对前代 Composer 1 的重大升级。新版本聚焦于复杂、多步骤编程任务的处理能力,在推理深度、上下文管理和响应效率上均实...大语言模型# Composer 1.5# Cursor2周前0300
Helcyon-Mercury-12B-v3.0:基于 Mistral Nemo 的高情感智能对话模型在本地大模型(Local LLM)生态中,大多数模型追求的是“能回答问题”或“会写代码”。但 Helcyon-Mercury-12B-v3.0 的目标截然不同——它不满足于做一台“聊天机器”,而是试图...大语言模型# Helcyon-Mercury-12B-v3.03周前0190
Voyage AI 推出Voyage 4 系列模型:共享嵌入空间 + 专家混合架构,重新定义文本嵌入效率Voyage AI 正式推出 Voyage 4 系列文本嵌入模型,带来两项行业首创技术:统一的共享嵌入空间 与 首个生产级 MoE(专家混合)嵌入模型。这一系列不仅在检索精度上树立新标杆,更通过灵活的...大语言模型# Voyage 4# Voyage AI# voyage-4-nano3周前0200
速度提升 25%,支持全栈开发!OpenAI发布GPT-5.3-Codex :从代码生成到全场景工程智能体,性能与安全双突破OpenAI 正式推出全新旗舰级编程智能体模型 GPT-5.3-Codex,作为迄今为止最强大的编码智能体,该模型融合 GPT-5.2-Codex 的前沿编码能力与 GPT-5.2 的通用推理、专业领...大语言模型# GPT-5.3-Codex# OpenAI3周前0910
Claude Opus 4.6正式发布:编程能力跃升,支持百万令牌上下文,办公协同全面升级Anthropic正式推出全新的Claude Opus 4.6大模型,作为其旗舰级智能模型的重磅升级版本,该模型在编程能力、长上下文处理、多任务推理等核心维度实现全面突破,同时首次在Opus系列中开放...大语言模型# Anthropic# Claude Opus 4.63周前0130
阿里Qwen3-Coder重磅发布:480B MoE模型拿下开源Agent编程SOTA,媲美Claude Sonnet4阿里Qwen项目组正式推出Qwen3-Coder系列代码模型,这是其迄今代理能力最强的代码模型版本,其中旗舰款Qwen3-Coder-480B-A35B-Instruct更是拉满配置——总参数量480...大语言模型# Claude Sonnet4# Qwen3-Coder# 阿里3周前03490
阶跃星辰推出Step 3.5 Flash:196B MoE 开源旗舰,推理与智能体性能对标闭源顶级模型Step 3.5 Flash 是阶跃星辰推出的开源旗舰语言推理模型,定位为当前最强大的开源基座之一,专为极致效率、深度推理、智能体(Agent)执行而生。 GitHub:https://github...大语言模型# Step 3.5 Flash# 阶跃星辰3周前0370
美团 LongCat 团队发布 LongCat-Flash-Thinking-2601:5600 亿参数智能体推理模型,支持深度思考与抗噪泛化美团 LongCat 团队正式推出 LongCat-Flash-Thinking-2601 —— 一款总参数量达 5600 亿、激活参数仅 270 亿 的高效混合专家(MoE)大模型。该模型专为现实世...大语言模型# LongCat# LongCat-Flash-Thinking-2601# 美团4周前01140