大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型

排序

发布更新浏览点赞

英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B

英伟达近日发布了一款专为复杂推理任务设计的开源模型 —— Nemotron-Research-Reasoning-Qwen-1.5B，该模型参数量为 1.5B，在数学、编程、科学问题和逻辑谜题等任务上...

大语言模型 # Nemotron-Research-Reasoning-Qwen-1.5B # 英伟达

6个月前

01080

MACHINELEARNINGLM：过持续预训练提升大语言模型在多示例上下文学习能力

中科院大学、华南理工大学、斯坦福大学的研究人员推出一种名为 MACHINELEARNINGLM 的新型框架，旨在通过持续预训练（continued pretraining）提升大语言模型（LLMs）在...

大语言模型 # MACHINELEARNINGLM

3个月前

01070

让语言模型“集体进化”：Gensyn推出去中心化强化学习新算法 SAPO

在提升语言模型推理能力的道路上，传统方法往往依赖大量人工标注数据进行监督微调（SFT），或集中式强化学习系统完成后训练。然而，这类方式成本高昂、扩展困难，且对硬件资源要求严苛。最近，AI初创公司 G...

大语言模型 # SAPO # 强化学习

3个月前

01050

谷歌发布 Gemini 2.5 Flash-Lite 稳定版：更快、更轻、更具成本效益

谷歌宣布，Gemini 2.5 Flash-Lite 正式进入稳定版本并全面开放使用。作为 Gemini 2.5 模型系列中速度最快、成本最低的成员，该模型旨在为大规模生产场景提供高性价比的智能推理能...

大语言模型 # Gemini 2.5 Flash-Lite # 谷歌

5个月前

01040

蚂蚁集团推出推理模型 Ring-mini-2.0

蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B，但每个输入 token 仅激活 14 亿个参数（非嵌入参数部分为 7.89 亿）。尽管 Ring-mini...

大语言模型 # Ring-mini-2.0 # 推理模型 # 蚂蚁集团

3个月前

0990

Anthropic 发布 Claude Sonnet 4.5：编程能力业界领先，可自主开发生产级应用，定价不变

周一，Anthropic 正式发布其最新前沿模型 Claude Sonnet 4.5，宣称在编程任务中实现“生产级”输出能力，标志着其在软件工程场景下的可靠性迈上新台阶。该模型即日起通过 Claud...

大语言模型 # Anthropic # Claude Sonnet 4.5 # 编程模型

3个月前

0980

微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计，为边缘设备、移动应用等资源受限环境提供高效的推理能...

大语言模型 # Phi-4-mini-flash-reasoning # 微软

5个月前

0960

Hugging Face发布SmolLM3：3B 级全能小模型，支持推理/非推理双模式与 128k 上下文

随着边缘计算和本地部署需求的增长，小型语言模型（Small Language Model, SLM）正在成为新一代 AI 应用的关键组成部分。近日，Hugging Face 推出了其最新力作 —— ...

大语言模型 # Hugging Face # SmolLM3 # 小模型

5个月前

0960

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover，Seed-Prover 通过结合 LLM 的推理能力和形式化语言（如 Lean）的验证能力，实现了对数学...

大语言模型 # Seed-Prover # 字节跳动 # 自动化定理证明

5个月前

0950

美团LongCat团队发布5600亿参数模型LongCat-Flash，以MoE架构突破效率与性能瓶颈

美团LongCat团队正式推出大语言模型LongCat-Flash，该模型以5600亿总参数规模为基础，创新采用专家混合（MoE）架构，通过动态计算、架构优化等核心设计，在训练效率、推理性能与实用能力...

大语言模型 # LongCat-Flash # 美团

4个月前

0930

Apriel-1.5-15B-Thinker：用中期训练提升多模态推理效率

在大模型竞赛普遍追求参数规模和算力投入的背景下，一个名为 Apriel-1.5-15B-Thinker 的新开源模型带来了不同的思路：它不依赖强化学习或偏好优化，也不从零训练，而是通过精心设计的中期训...

大语言模型 # Apriel-1.5-15B-Thinker

2个月前

0910

Anthropic发布Claude Haiku 4.5：三分之一成本+两倍速度，编码性能追平Sonnet 4

Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是，在保持与Claude Sonnet 4相当编码性能的同时，将成本压缩...

大语言模型 # Anthropic # Claude Haiku 4.5

2个月前

0860

加载更多

英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B

MACHINELEARNINGLM：过持续预训练提升大语言模型在多示例上下文学习能力

让语言模型“集体进化”：Gensyn推出去中心化强化学习新算法 SAPO

谷歌发布 Gemini 2.5 Flash-Lite 稳定版：更快、更轻、更具成本效益

蚂蚁集团推出推理模型 Ring-mini-2.0

Anthropic 发布 Claude Sonnet 4.5：编程能力业界领先，可自主开发生产级应用，定价不变

微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

Hugging Face发布SmolLM3：3B 级全能小模型，支持推理/非推理双模式与 128k 上下文

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

美团LongCat团队发布5600亿参数模型LongCat-Flash，以MoE架构突破效率与性能瓶颈

Apriel-1.5-15B-Thinker：用中期训练提升多模态推理效率

Anthropic发布Claude Haiku 4.5：三分之一成本+两倍速度，编码性能追平Sonnet 4

朱雀大模型检测

Fogsight (雾象)

Tripo

新人生 K 线

秒哒

Google AI Studio

大语言模型

网址

朱雀大模型检测

Fogsight (雾象)

Tripo

新人生 K 线

秒哒

Google AI Studio