大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Qwen3-Max 发布：阿里通义迄今最强语言模型，已开放 API

在 Qwen3-2507 系列全面上线后，阿里通义实验室正式推出 Qwen3-Max——迄今为止参数规模最大、综合能力最强的 Qwen 模型。作为 Qwen3 系列的旗舰型号，Qwen3-Max 不...

大语言模型 # Qwen3-Max

4个月前

03350

LFM2-2.6B发布：小参数，高性能，重新定义语言模型效率

在大模型“军备竞赛”愈演愈烈的今天，参数规模是否仍是衡量能力的唯一标准？ Liquid AI 最新推出的 LFM2-2.6B 给出了一个有力的回答：更优的架构设计，可以让更小的模型，在关键任务上超越...

大语言模型 # LFM2-2.6B

4个月前

01490

Qwen3Guard发布：阿里通义实验室推出首款安全护栏模型

阿里通义实验室 Qwen 项目组正式推出 Qwen3Guard —— Qwen 家族中首款专为内容安全设计的护栏模型（Safety Guardrail Model）。该模型基于强大的 Qwen3 架...

大语言模型 # Qwen3Guard # 安全护栏模型

4个月前

04920

LIMI ：少即是多，78个样本如何训练出高效AI智能体

由上海交通大学、上海创智学院、香港理工大学、中国科学技术大学与GAIR联合开展的一项研究，最近提出了一个名为 LIMI 的新方法——全称为 Less is More for Intelligent A...

大语言模型 # LIMI # 智能体

4个月前

01720

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

美团 LongCat 团队正式推出 LongCat-Flash-Thinking——一款专注于高复杂度任务推理的大型语言模型（LRM）。该模型在保持前代 LongCat-Flash-Chat 高效响应...

大语言模型 # LongCat-Flash-Thinking # 推理模型 # 美团

4个月前

01570

浙大×华为联合推出 DeepSeek-R1-Safe：基于昇腾的安全大模型

浙江大学网络空间安全学院与华为合作，发布了一款基于 DeepSeek 模型架构的安全增强型大语言模型 —— DeepSeek-R1-Safe。该模型依托华为昇腾（Ascend）AI 芯片及 Mind...

大语言模型 # DeepSeek-R1-Safe # 华为

4个月前

02050

FastMTP：通过增强多令牌预测提升大模型推理效率

在大语言模型（LLM）的实际应用中，推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升，但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码（Speculative Dec...

大语言模型 # FastMTP # 推理模型

4个月前

01620

蚂蚁集团开源 Ring-flash-2.0：高效 MoE 架构下的高性能思考模型

蚂蚁集团正式宣布开源 Ring-flash-2.0 ——一款基于 MoE（混合专家）架构的高性能“思考型”大语言模型。该模型总参数量达 100B，但在每次推理时仅激活 6.1B 参数（其中非嵌入部分约...

大语言模型 # Ring-flash-2.0 # 蚂蚁集团

4个月前

02620

通义 DeepResearch：首个全开源 Web Agent，性能对标 OpenAI 深度研究模型

阿里通义实验室正式发布 Tongyi DeepResearch —— 一个在性能上可与当前最先进闭源系统相媲美的全开源 Web Agent。项目主页：https://tongyi-agent.git...

大语言模型 # Tongyi DeepResearch # 深度研究模型

5个月前

03130

MACHINELEARNINGLM：过持续预训练提升大语言模型在多示例上下文学习能力

中科院大学、华南理工大学、斯坦福大学的研究人员推出一种名为 MACHINELEARNINGLM 的新型框架，旨在通过持续预训练（continued pretraining）提升大语言模型（LLMs）在...

大语言模型 # MACHINELEARNINGLM

5个月前

01150

华为开源盘古 Embedded-7B-V1.1：支持“快慢思考”的高效大模型

华为正式开源新一代高效大语言模型 —— openPangu-Embedded-7B-V1.1。该模型是基于昇腾 NPU 从零训练的 7B 级别密集架构模型（不含词表 Embedding），在通用能力...

大语言模型 # openPangu-Embedded-7B-V1.1 # 华为 # 盘古

5个月前

02970

让语言模型“集体进化”：Gensyn推出去中心化强化学习新算法 SAPO

在提升语言模型推理能力的道路上，传统方法往往依赖大量人工标注数据进行监督微调（SFT），或集中式强化学习系统完成后训练。然而，这类方式成本高昂、扩展困难，且对硬件资源要求严苛。最近，AI初创公司 G...

大语言模型 # SAPO # 强化学习

5个月前

01060

加载更多

Qwen3-Max 发布：阿里通义迄今最强语言模型，已开放 API

LFM2-2.6B发布：小参数，高性能，重新定义语言模型效率

Qwen3Guard发布：阿里通义实验室推出首款安全护栏模型

LIMI ：少即是多，78个样本如何训练出高效AI智能体

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

浙大×华为联合推出 DeepSeek-R1-Safe：基于昇腾的安全大模型

FastMTP：通过增强多令牌预测提升大模型推理效率

蚂蚁集团开源 Ring-flash-2.0：高效 MoE 架构下的高性能思考模型

通义 DeepResearch：首个全开源 Web Agent，性能对标 OpenAI 深度研究模型

MACHINELEARNINGLM：过持续预训练提升大语言模型在多示例上下文学习能力

华为开源盘古 Embedded-7B-V1.1：支持“快慢思考”的高效大模型

让语言模型“集体进化”：Gensyn推出去中心化强化学习新算法 SAPO

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

新QoderWork

Fogsight (雾象)

CivitAI

大语言模型

网址

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

新QoderWork

Fogsight (雾象)

CivitAI