大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

智谱发布 GLM-4.6：200K 上下文、30% 更省，专为编程优化

今日，智谱 AI 正式推出其最新旗舰文本模型 GLM-4.6，作为 GLM 系列的最新迭代版本，该模型在推理、编码与智能体能力上实现全面升级，定位为当前国内最强的代码专用大模型。项目主页：https...

5个月前

0760

蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

在大模型迈向“深度思考”的关键阶段，蚂蚁集团迈出重要一步：其自研的万亿参数自然语言推理大模型 Ring-1T-preview 正式上线 Hugging Face，成为全球首个开源的万亿参数级推理专用大...

大语言模型 # Ring-1T-preview # 推理大模型 # 蚂蚁集团

5个月前

01160

Anthropic 发布 Claude Sonnet 4.5：编程能力业界领先，可自主开发生产级应用，定价不变

周一，Anthropic 正式发布其最新前沿模型 Claude Sonnet 4.5，宣称在编程任务中实现“生产级”输出能力，标志着其在软件工程场景下的可靠性迈上新台阶。该模型即日起通过 Claud...

大语言模型 # Anthropic # Claude Sonnet 4.5 # 编程模型

5个月前

01000

DeepSeek 发布DeepSeek-V3.2-Exp：首次引入细粒度稀疏注意力，API 成本直降 50%+

在国庆节假期前夕，DeepSeek 正式推出 DeepSeek-V3.2-Exp ——一个面向未来架构演进的实验性（Experimental）版本。该模型并非最终发布版，而是通向新一代高效架构的关键中...

大语言模型 # DeepSeek # DeepSeek-V3.2-Exp

5个月前

01980

谷歌发布推出改进的 Gemini 2.5 Flash 和 Flash-Lite 版本：响应更快、成本更低、智能更强

谷歌今日推出 Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite 的预览更新版本，已在 Google AI Studio 与 Vertex AI 平台上线。此次升级聚焦于...

大语言模型 # Gemini 2.5 Flash # Gemini 2.5 Flash-Lite # 谷歌

5个月前

02160

Meta 开源代码世界模型CWM：让AI像程序员一样"推演"代码的世界模型

Meta近日发布并开源代码世界模型（Code World Model, CWM），这是一款320亿参数的仅解码器大型语言模型（LLM），支持最长131k tokens的上下文长度。不同于传统代码模型仅...

大语言模型 # CWM # Meta # 代码世界模型

5个月前

02060

Qwen3-Max 发布：阿里通义迄今最强语言模型，已开放 API

在 Qwen3-2507 系列全面上线后，阿里通义实验室正式推出 Qwen3-Max——迄今为止参数规模最大、综合能力最强的 Qwen 模型。作为 Qwen3 系列的旗舰型号，Qwen3-Max 不...

大语言模型 # Qwen3-Max

5个月前

03820

LFM2-2.6B发布：小参数，高性能，重新定义语言模型效率

在大模型“军备竞赛”愈演愈烈的今天，参数规模是否仍是衡量能力的唯一标准？ Liquid AI 最新推出的 LFM2-2.6B 给出了一个有力的回答：更优的架构设计，可以让更小的模型，在关键任务上超越...

大语言模型 # LFM2-2.6B

5个月前

01610

Qwen3Guard发布：阿里通义实验室推出首款安全护栏模型

阿里通义实验室 Qwen 项目组正式推出 Qwen3Guard —— Qwen 家族中首款专为内容安全设计的护栏模型（Safety Guardrail Model）。该模型基于强大的 Qwen3 架...

大语言模型 # Qwen3Guard # 安全护栏模型

5个月前

05250

LIMI ：少即是多，78个样本如何训练出高效AI智能体

由上海交通大学、上海创智学院、香港理工大学、中国科学技术大学与GAIR联合开展的一项研究，最近提出了一个名为 LIMI 的新方法——全称为 Less is More for Intelligent A...

大语言模型 # LIMI # 智能体

5个月前

01810

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

美团 LongCat 团队正式推出 LongCat-Flash-Thinking——一款专注于高复杂度任务推理的大型语言模型（LRM）。该模型在保持前代 LongCat-Flash-Chat 高效响应...

大语言模型 # LongCat-Flash-Thinking # 推理模型 # 美团

5个月前

01600

浙大×华为联合推出 DeepSeek-R1-Safe：基于昇腾的安全大模型

浙江大学网络空间安全学院与华为合作，发布了一款基于 DeepSeek 模型架构的安全增强型大语言模型 —— DeepSeek-R1-Safe。该模型依托华为昇腾（Ascend）AI 芯片及 Mind...

大语言模型 # DeepSeek-R1-Safe # 华为

5个月前

02430

加载更多

智谱发布 GLM-4.6：200K 上下文、30% 更省，专为编程优化

蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

Anthropic 发布 Claude Sonnet 4.5：编程能力业界领先，可自主开发生产级应用，定价不变

DeepSeek 发布DeepSeek-V3.2-Exp：首次引入细粒度稀疏注意力，API 成本直降 50%+

谷歌发布推出改进的 Gemini 2.5 Flash 和 Flash-Lite 版本：响应更快、成本更低、智能更强

Meta 开源代码世界模型CWM：让AI像程序员一样"推演"代码的世界模型

Qwen3-Max 发布：阿里通义迄今最强语言模型，已开放 API

LFM2-2.6B发布：小参数，高性能，重新定义语言模型效率

Qwen3Guard发布：阿里通义实验室推出首款安全护栏模型

LIMI ：少即是多，78个样本如何训练出高效AI智能体

美团 LongCat 团队发布 LongCat-Flash-Thinking：具备形式化与智能体推理能力的新一代高效推理模型

浙大×华为联合推出 DeepSeek-R1-Safe：基于昇腾的安全大模型

OpenClaw

A股智能分析系统

OpenClaw（Clawdbot/Moltbot）

Skills.sh

3D Arena

BuildCores

大语言模型

网址

OpenClaw

A股智能分析系统

OpenClaw（Clawdbot/Moltbot）

Skills.sh

3D Arena

BuildCores