大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Reka AI发布推理模型Reka Flash 3.1 ：强化学习驱动的高效推理模型升级

Reka AI 正式发布了其推理模型 Reka Flash 3.1，这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出，并作为 Re...

7个月前

01480

Kimina-Prover：首个实现人类级形式推理的大型定理证明模型

由 Numina 与 Kimi 团队联合开发的 Kimina-Prover-72B 正式发布。这是目前在 Lean 4 形式化语言中，首个能够以接近人类方式推理并自动构建数学定理证明的大型神经定理证明...

大语言模型 # Kimina-Prover # 大型定理证明模型

7个月前

02500

Sarvam AI 发布 Sarvam-Translate：支持印度22种语言的文档级翻译模型

Sarvam AI 推出了其最新翻译模型 Sarvam-Translate，一款专注于支持印度 22 种官方语言的高质量、上下文感知翻译系统。该模型基于 Google 的 Gemma3-4B-IT 进...

大语言模型 # Sarvam AI # Sarvam-Translate # 翻译模型

7个月前

01390

微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计，为边缘设备、移动应用等资源受限环境提供高效的推理能...

大语言模型 # Phi-4-mini-flash-reasoning # 微软

7个月前

0990

T5Gemma：谷歌推出全新编码器-解码器 Gemma 模型系列

在当前大语言模型（LLM）领域中，解码器独占架构凭借其强大的生成能力成为主流。然而，经典的编码器-解码器架构——如 T5（文本到文本转换变换器）——因其出色的推理效率、灵活的设计以及对输入语义的深度理...

大语言模型 # T5Gemma # 解码器 # 谷歌

7个月前

04090

字节跳动 & 南大联合推出 CriticLean 框架：让 AI 更准确地翻译数学为代码

将自然语言数学语句自动转化为形式化代码（如 Lean 4）是计算数学中的核心挑战之一。尽管已有许多自动化工具尝试解决这一问题，但其准确性仍面临瓶颈，尤其是在需要深入理解语义的复杂场景中。为此，字节跳...

大语言模型 # CriticLean # 字节跳动

7个月前

01690

微软推出 NextCoder：基于 Qwen2.5-Coder 的高效代码编辑模型

近年来，软件开发中的代码编辑需求日益增长，尤其是在维护和重构已有项目时。然而，现有的大语言模型在面对多样化的代码修改任务时，往往表现不佳。为了解决这一问题，微软联合相关研究团队提出了一套全新的方法，并...

大语言模型 # NextCoder # Qwen2.5-Coder # 代码编辑模型

7个月前

02300

Hugging Face发布SmolLM3：3B 级全能小模型，支持推理/非推理双模式与 128k 上下文

随着边缘计算和本地部署需求的增长，小型语言模型（Small Language Model, SLM）正在成为新一代 AI 应用的关键组成部分。近日，Hugging Face 推出了其最新力作 —— ...

大语言模型 # Hugging Face # SmolLM3 # 小模型

7个月前

0980

Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B：实现 93% 准确率，无需昂贵微调

在 LLM（大语言模型）应用场景日益复杂的背景下，如何将用户查询智能路由到最合适的模型，成为提升效率和体验的关键挑战。近日，Katanemo Labs 推出了一个创新的解决方案 —— Arch-Ro...

大语言模型 # Arch-Router-1.5B # 路由模型

7个月前

01340

阿里通义实验室开源 WebSailor，登顶 BrowseComp 榜单的网络智能体

近日，阿里云通义实验室正式开源了一款名为 WebSailor 的新型网络智能体（Web Agent），它具备强大的多步推理与信息检索能力，在高难度网页导航任务中表现出色。 GitHub：https...

大语言模型 # WebSailor # 网络智能体 # 阿里通义实验室

7个月前

02310

MemOS：为大语言模型设计的长期记忆操作系统

MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型（LLMs）设计的长期记忆操作系统。项目主页：https...

大语言模型 # MemOS # 大语言模型

7个月前

04790

华为正式开源盘古大模型与昇腾推理技术

周一，华为宣布一项重大举措：开源其盘古70亿参数（7B）密集模型和720亿参数（72B）Pro MoE混合专家模型，以及基于昇腾平台的高效推理技术。这一动作被视为华为持续推进大型AI模型研究与产业应...

大语言模型 # 华为 # 盘古大模型

7个月前

01890

加载更多

Reka AI发布推理模型Reka Flash 3.1 ：强化学习驱动的高效推理模型升级

Kimina-Prover：首个实现人类级形式推理的大型定理证明模型

Sarvam AI 发布 Sarvam-Translate：支持印度22种语言的文档级翻译模型

微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

T5Gemma：谷歌推出全新编码器-解码器 Gemma 模型系列

字节跳动 & 南大联合推出 CriticLean 框架：让 AI 更准确地翻译数学为代码

微软推出 NextCoder：基于 Qwen2.5-Coder 的高效代码编辑模型

Hugging Face发布SmolLM3：3B 级全能小模型，支持推理/非推理双模式与 128k 上下文

Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B：实现 93% 准确率，无需昂贵微调

阿里通义实验室开源 WebSailor，登顶 BrowseComp 榜单的网络智能体

MemOS：为大语言模型设计的长期记忆操作系统

华为正式开源盘古大模型与昇腾推理技术

新QoderWork

Clawdbot/Moltbot

Situation Monitor

CutCut

中国科技云数据胶囊

Skills.sh

大语言模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

CutCut

中国科技云数据胶囊

Skills.sh