大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

蚂蚁集团 inclusionAI 团队推出Ring-2.5-1T：全球首个万亿参数混合线性注意力思维模型

蚂蚁集团 inclusionAI 团队正式推出 Ring-2.5-1T，这是全球首个基于混合线性注意力架构的开源万亿参数思维模型，标志着向通用人工智能体迈出关键一步。 Hugging Face ：ht...

大语言模型 # Ring-2.5-1T # 蚂蚁集团

2周前

0100

Nanbeige4.1-3B：在保持小参数规模的同时，实现强大推理、偏好对齐与高效智能体能力

Nanbeige4.1-3B 基于 Nanbeige4-3B-Base 架构构建，是Nanbeige团队此前推出的推理专用模型 Nanbeige4-3B-Thinking-2511 的全面增强迭代版本...

大语言模型 # Nanbeige4.1-3B # 推理模型

2周前

0260

MiniMax正式发布MiniMax M2.5 ：更快、更强、更智能，专为现实生产力打造

今天，MiniMax 正式推出全新一代大模型——MiniMax M2.5。这款模型依托在数十万个复杂真实世界环境中开展的大规模强化学习训练，实现了能力的全面升级。在编程开发、智能体工具使用与信息搜索...

大语言模型早报 # MiniMax # MiniMax M2.5

2周前

02310

智谱AI正式发布GLM-5：744B参数+28.5T数据，长周期智能体能力登顶开源第一

智谱AI正式推出新一代通用大模型——GLM-5，这款模型在设计之初就明确了核心定位：面向复杂系统工程和长周期智能体任务，致力于打破基础模型“只能聊天、难以落地”的局限，实现从“氛围编程”到“智能体工程...

大语言模型 # GLM-5 # 智谱AI

2周前

0280

Cursor 发布 Composer 1.5：强化学习提升 20 倍，支持复杂代码推理

Cursor 团队近日正式推出其智能编程模型 Composer 1.5，作为对前代 Composer 1 的重大升级。新版本聚焦于复杂、多步骤编程任务的处理能力，在推理深度、上下文管理和响应效率上均实...

大语言模型 # Composer 1.5 # Cursor

2周前

0300

Helcyon-Mercury-12B-v3.0：基于 Mistral Nemo 的高情感智能对话模型

在本地大模型（Local LLM）生态中，大多数模型追求的是“能回答问题”或“会写代码”。但 Helcyon-Mercury-12B-v3.0 的目标截然不同——它不满足于做一台“聊天机器”，而是试图...

大语言模型 # Helcyon-Mercury-12B-v3.0

3周前

0190

Voyage AI 推出Voyage 4 系列模型：共享嵌入空间 + 专家混合架构，重新定义文本嵌入效率

Voyage AI 正式推出 Voyage 4 系列文本嵌入模型，带来两项行业首创技术：统一的共享嵌入空间与首个生产级 MoE（专家混合）嵌入模型。这一系列不仅在检索精度上树立新标杆，更通过灵活的...

大语言模型 # Voyage 4 # Voyage AI # voyage-4-nano

3周前

0200

速度提升 25%，支持全栈开发！OpenAI发布GPT-5.3-Codex ：从代码生成到全场景工程智能体，性能与安全双突破

OpenAI 正式推出全新旗舰级编程智能体模型 GPT-5.3-Codex，作为迄今为止最强大的编码智能体，该模型融合 GPT-5.2-Codex 的前沿编码能力与 GPT-5.2 的通用推理、专业领...

大语言模型 # GPT-5.3-Codex # OpenAI

3周前

0910

Claude Opus 4.6正式发布：编程能力跃升，支持百万令牌上下文，办公协同全面升级

Anthropic正式推出全新的Claude Opus 4.6大模型，作为其旗舰级智能模型的重磅升级版本，该模型在编程能力、长上下文处理、多任务推理等核心维度实现全面突破，同时首次在Opus系列中开放...

大语言模型 # Anthropic # Claude Opus 4.6

3周前

0130

阿里Qwen3-Coder重磅发布：480B MoE模型拿下开源Agent编程SOTA，媲美Claude Sonnet4

阿里Qwen项目组正式推出Qwen3-Coder系列代码模型，这是其迄今代理能力最强的代码模型版本，其中旗舰款Qwen3-Coder-480B-A35B-Instruct更是拉满配置——总参数量480...

大语言模型 # Claude Sonnet4 # Qwen3-Coder # 阿里

3周前

03490

阶跃星辰推出Step 3.5 Flash：196B MoE 开源旗舰，推理与智能体性能对标闭源顶级模型

Step 3.5 Flash 是阶跃星辰推出的开源旗舰语言推理模型，定位为当前最强大的开源基座之一，专为极致效率、深度推理、智能体（Agent）执行而生。 GitHub：https://github...

大语言模型 # Step 3.5 Flash # 阶跃星辰

3周前

0370

美团 LongCat 团队发布 LongCat-Flash-Thinking-2601：5600 亿参数智能体推理模型，支持深度思考与抗噪泛化

美团 LongCat 团队正式推出 LongCat-Flash-Thinking-2601 —— 一款总参数量达 5600 亿、激活参数仅 270 亿的高效混合专家（MoE）大模型。该模型专为现实世...

大语言模型 # LongCat # LongCat-Flash-Thinking-2601 # 美团

4周前

01140

加载更多