英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B英伟达近日发布了一款专为复杂推理任务设计的开源模型 —— Nemotron-Research-Reasoning-Qwen-1.5B,该模型参数量为 1.5B,在数学、编程、科学问题和逻辑谜题等任务上...大语言模型# Nemotron-Research-Reasoning-Qwen-1.5B# 英伟达6个月前01080
MACHINELEARNINGLM:过持续预训练提升大语言模型在多示例上下文学习能力中科院大学、华南理工大学、斯坦福大学的研究人员推出一种名为 MACHINELEARNINGLM 的新型框架,旨在通过持续预训练(continued pretraining)提升大语言模型(LLMs)在...大语言模型# MACHINELEARNINGLM3个月前01070
让语言模型“集体进化”:Gensyn推出去中心化强化学习新算法 SAPO在提升语言模型推理能力的道路上,传统方法往往依赖大量人工标注数据进行监督微调(SFT),或集中式强化学习系统完成后训练。然而,这类方式成本高昂、扩展困难,且对硬件资源要求严苛。 最近,AI初创公司 G...大语言模型# SAPO# 强化学习3个月前01050
谷歌发布 Gemini 2.5 Flash-Lite 稳定版:更快、更轻、更具成本效益谷歌宣布,Gemini 2.5 Flash-Lite 正式进入稳定版本并全面开放使用。作为 Gemini 2.5 模型系列中速度最快、成本最低的成员,该模型旨在为大规模生产场景提供高性价比的智能推理能...大语言模型# Gemini 2.5 Flash-Lite# 谷歌5个月前01040
蚂蚁集团推出推理模型 Ring-mini-2.0蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B,但每个输入 token 仅激活 14 亿个参数(非嵌入参数部分为 7.89 亿)。尽管 Ring-mini...大语言模型# Ring-mini-2.0# 推理模型# 蚂蚁集团3个月前0990
Anthropic 发布 Claude Sonnet 4.5:编程能力业界领先,可自主开发生产级应用,定价不变周一,Anthropic 正式发布其最新前沿模型 Claude Sonnet 4.5,宣称在编程任务中实现“生产级”输出能力,标志着其在软件工程场景下的可靠性迈上新台阶。 该模型即日起通过 Claud...大语言模型# Anthropic# Claude Sonnet 4.5# 编程模型3个月前0980
微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计,为边缘设备、移动应用等资源受限环境提供高效的推理能...大语言模型# Phi-4-mini-flash-reasoning# 微软5个月前0960
Hugging Face发布SmolLM3:3B 级全能小模型,支持推理/非推理双模式与 128k 上下文随着边缘计算和本地部署需求的增长,小型语言模型(Small Language Model, SLM) 正在成为新一代 AI 应用的关键组成部分。近日,Hugging Face 推出了其最新力作 —— ...大语言模型# Hugging Face# SmolLM3# 小模型5个月前0960
字节跳动Seed项目组推出基于大语言模型(LLM)的自动化定理证明系统 Seed-Prover字节跳动Seed项目组推出基于大语言模型(LLM)的自动化定理证明系统 Seed-Prover,Seed-Prover 通过结合 LLM 的推理能力和形式化语言(如 Lean)的验证能力,实现了对数学...大语言模型# Seed-Prover# 字节跳动# 自动化定理证明5个月前0950
美团LongCat团队发布5600亿参数模型LongCat-Flash,以MoE架构突破效率与性能瓶颈美团LongCat团队正式推出大语言模型LongCat-Flash,该模型以5600亿总参数规模为基础,创新采用专家混合(MoE)架构,通过动态计算、架构优化等核心设计,在训练效率、推理性能与实用能力...大语言模型# LongCat-Flash# 美团4个月前0930
Apriel-1.5-15B-Thinker:用中期训练提升多模态推理效率在大模型竞赛普遍追求参数规模和算力投入的背景下,一个名为 Apriel-1.5-15B-Thinker 的新开源模型带来了不同的思路:它不依赖强化学习或偏好优化,也不从零训练,而是通过精心设计的中期训...大语言模型# Apriel-1.5-15B-Thinker2个月前0910
Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是,在保持与Claude Sonnet 4相当编码性能的同时,将成本压缩...大语言模型# Anthropic# Claude Haiku 4.52个月前0860