九坤至知开源代码大模型IQuest‑Coder‑V1:Code‑Flow训练+双路径优化,40B模型重塑代码大模型性能边界2026年初,量化基金公司九坤旗下至知创新研究院正式开源IQuest‑Coder‑V1系列代码大模型,涵盖7B、14B、40B、40B‑Loop等版本,专注软件工程与竞赛编程场景,目前已释出40B模型...大语言模型# IQuest‑Coder‑V1# 九坤# 代码大模型6天前0710
MiniMax 发布 MiniMax-M2.1::更智能、更高效、支持多语言的编码与智能体模型在推出专为智能体和代码任务设计的 M2 模型仅数月后,MiniMax 正式发布其增强版本 —— M2.1。 M2 本就以极低成本(约为 Claude Sonnet 的 8%)和高推理速度著称,更引入了...大语言模型# M2.1# MiniMax# MiniMax-M2.1:2周前0210
Liquid AI 发布 LFM2-2.6B-Exp:小模型大性能,指令遵循能力超越百倍规模对手Liquid AI 正式推出 LFM2-2.6B-Exp —— 一个基于纯强化学习(RL)训练的实验性语言模型。它在指令遵循、常识推理和数学任务上表现突出,尤其值得注意的是:其 IFBench 评测分...大语言模型# LFM2-2.6B-Exp# Liquid AI2周前0110
智谱AI发布GLM-4.7:聚焦编程、工具使用与多轮推理智谱AI最新发布的 GLM-4.7 在多个关键维度实现突破,特别是在开发者关注的编程、工具调用与复杂推理能力上,带来可观的性能提升。本文将系统梳理 GLM-4.7 的主要改进,并说明如何快速接入与使用...大语言模型# GLM-4.7# 智谱AI2周前0220
英伟达发布 Nemotron 3 系列:30B Nano 即用,Super/Ultra 2026 年登场英伟达正式推出 Nemotron 3 开源模型系列,聚焦多智能体协作场景,包含 Nano、Super、Ultra 三个版本,覆盖从轻量推理到超大规模智能体系统的全栈需求。 模型:https://hug...大语言模型# Nemotron 3# 英伟达2周前0190
艾伦AI研究所推出 Olmo 3.1:更强的 32B 开源聊天与推理模型艾伦人工智能研究所(AI2)发布了 Olmo 3.1,这是 Olmo 3 系列的最新迭代。此次更新包含两个 32B 参数的新模型检查点,以及多个 7B 规模的强化学习变体,进一步推动了高性能与全开源的...大语言模型# Olmo 3.12周前0250
FunctionGemma:谷歌发布 2.7 亿参数边缘函数调用模型,让设备“听懂即执行”在 Gemini 3 引发广泛关注的同时,谷歌悄然推出了一款面向边缘设备的专用小模型——FunctionGemma。它不是另一个聊天机器人,而是一个能在手机、浏览器或 IoT 设备上本地运行的“行动引...大语言模型# FunctionGemma# 谷歌# 边缘函数调用模型3周前0200
OpenAI正式发布GPT-5.2 :GDPval 超人类专家,编码/长上下文/视觉能力全面跃升OpenAI 再度刷新大模型天花板——GPT-5.2 正式发布。这款专为专业知识工作和长期运行智能体打造的前沿模型,在编码、长上下文推理、视觉理解、工具调用等核心能力上实现跨越式提升,甚至在覆盖 44...大语言模型早报# GPT-5.2# OpenAI4周前0360
Mistral AI 发布 Devstral 2 编程模型+Vibe CLI:1230亿参数适配智能体开发,终端原生编程更高效Mistral AI 推出两大核心产品——新一代软件工程智能体编程模型家族 Devstral 2,以及开源命令行编程助手 Mistral Vibe CLI。前者以高参数、长上下文和高性价比成为开源编程...大语言模型# Devstral 2# Mistral AI# 编程模型4周前0280
腾讯发布混元 2.0 大模型:406B MoE 架构,256K 上下文,推理效率国内领先腾讯正式发布自研大模型 混元 2.0(Tencent HY 2.0),包含 HY 2.0 Think(推理优化版)与 HY 2.0 Instruct(指令对齐版)两个版本。该模型采用 混合专家(MoE...大语言模型# 混元 2.0 大模型# 腾讯1个月前0290
亚马逊推出全新Nova模型系列及开创性服务:Nova Forge与Nova Act核心要点 Nova 2 模型系列在推理、多模态处理、对话式AI、代码生成及智能体任务方面提供业界领先的性价比。 Nova Forge 服务允许企业通过其独特的“开放训练”方法,在训练早期融入专有数据...大语言模型# NOVA# Nova Act# Nova Forge1个月前0240
DeepSeek V3.2正式发布:推理能力追平GPT-5,首个思考+工具调用开源模型经过两个多月测试,DeepSeek 正式推出 V3.2 系列模型,包括平衡型主力版本 DeepSeek V3.2 与极致推理增强版 DeepSeek V3.2 Speciale。前者以“推理能力不逊 ...大语言模型早报# DeepSeek V3.21个月前0780