大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

阿里发布 Qwen3-4B 双模型：小参数，大能力，原生支持 256K 上下文

在大模型“军备竞赛”愈演愈烈的今天，阿里巴巴通义实验室反其道而行之，推出两款 40 亿参数级别的小型语言模型： Qwen3-4B-Instruct-2507：面向多语言、高响应速度的通用指令模型 Q...

8个月前

04300

SWE-Swiss-32B 发布：一个在软件修复任务上达到顶尖水平的 32B 开源模型

由北京大学、字节跳动 SEED 团队与香港大学联合研发的 SWE-Swiss-32B 正式亮相。该模型在 SWE-bench Verified 基准测试中取得 60.2% 的通过率，不仅在同规模开源...

大语言模型 # SWE-Swiss # SWE-Swiss-32B

8个月前

05610

OpenAI 发布 GPT-5：更智能、更诚实、更实用的统一模型

OpenAI在今天发布了其最新模型GPT-5，这是它们迄今为止最智能、快速和实用的模型，内置思考能力，将专家级智能赋予每个人。（官方博文介绍） OpenAI隆重推出 GPT-5，这是penAI迄今最好...

大语言模型 # GPT-5 # OpenAI

8个月前

03720

Intelligent Internet 发布两款新型搜索推理模型：II-Search-4B 与 II-Search-CIR 4B

Intelligent Internet（II）正式推出两款专注于信息检索与复杂推理的开源语言模型： II-Search-4B：面向多跳检索与事实验证的高效4B级模型 II-Search-CIR 4B...

大语言模型 # II-Search-4B # II-Search-CIR 4B # Intelligent Internet

8个月前

02280

Anthropic发布 Claude Opus 4.1：代理任务、现实世界编码和推理的升级

Anthropic今天发布了 Claude Opus 4.1，这是对 Claude Opus 4 在代理任务、现实世界编码和推理方面的升级。我们计划在未来几周发布对模型的更大改进。 Claude Op...

大语言模型 # Anthropic # Claude Opus 4.1

8个月前

03850

OpenAI 发布两款高性能模型免费可商用开源大模型gpt-oss-120b 与 gpt-oss-20b，在本地运行接近 o4-mini 的模型

OpenAI 今日正式发布两款开放权重语言模型：gpt-oss-120b 和 gpt-oss-20b。这是自 GPT-2 以来，OpenAI 首次向公众开放其语言模型权重，标志着公司在开放性与透明度...

大语言模型 # gpt-oss-120b # gpt-oss-20b # OpenAI

8个月前

01630

Mistral AI宣布推出 Codestral 25.08 和完整的 Mistral 企业编码栈

Mistral AI 今日宣布推出 Codestral 25.08，并同步发布其完整的 Mistral 企业编码栈（Mistral Coding Stack for Enterprise）。这不是一...

大语言模型 # Codestral 25.08 # Mistral AI

8个月前

02450

Deep Cogito发布Cogito v2 预览版：从“思考更多”到“直觉更强”的推理范式跃迁

Deep Cogito 今日正式发布 Cogito v2 预览版，推出四款开源混合推理模型： 70B 密集型 109B MoE 405B 密集型 671B MoE 其中，671B MoE 是当前全球最...

大语言模型 # Cogito v2 # Deep Cogito

8个月前

04730

腾讯混元发布四款小尺寸开源模型，端侧 AI 应用迎来新选择

继此前开源大尺寸模型后，腾讯混元团队近日推出四款全新小尺寸开源模型，参数量分别为 0.5B、1.8B、4B 和 7B。这些模型专为低功耗、资源受限场景设计，可在消费级显卡、笔记本电脑、手机、智能座舱及...

大语言模型 # 腾讯混元

8个月前

03790

面向代码修复与优化任务的经验驱动型实验框架SWE-Exp

在自动化软件工程领域，一个长期存在的挑战是：如何让 AI 代理不仅“能修代码”，还能“会总结、能举一反三”？上海交通大学、华为、加州大学圣地亚哥分校与西安电子科技大学的联合研究团队近日提出 SWE...

大语言模型 # SWE-Exp # 软件工程

8个月前

02310

问小白开源基于反思型生成范式训练的推理模型XBai o4

问小白发布了XBai o4，o=open，o4代表其开源的第四代大模型技术。XBai o4在复杂推理能力方面表现出色，在Medium模式下，XBai o4 现已全面超越OpenAI-o3-mini。 ...

大语言模型 # XBai o4 # 问小白

8个月前

02350

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover，Seed-Prover 通过结合 LLM 的推理能力和形式化语言（如 Lean）的验证能力，实现了对数学...

大语言模型 # Seed-Prover # 字节跳动 # 自动化定理证明

8个月前

01050

加载更多

阿里发布 Qwen3-4B 双模型：小参数，大能力，原生支持 256K 上下文

SWE-Swiss-32B 发布：一个在软件修复任务上达到顶尖水平的 32B 开源模型

OpenAI 发布 GPT-5：更智能、更诚实、更实用的统一模型

Intelligent Internet 发布两款新型搜索推理模型：II-Search-4B 与 II-Search-CIR 4B

Anthropic发布 Claude Opus 4.1：代理任务、现实世界编码和推理的升级

OpenAI 发布两款高性能模型免费可商用开源大模型gpt-oss-120b 与 gpt-oss-20b，在本地运行接近 o4-mini 的模型

Mistral AI宣布推出 Codestral 25.08 和完整的 Mistral 企业编码栈

Deep Cogito发布Cogito v2 预览版：从“思考更多”到“直觉更强”的推理范式跃迁

腾讯混元发布四款小尺寸开源模型，端侧 AI 应用迎来新选择

面向代码修复与优化任务的经验驱动型实验框架SWE-Exp

问小白开源基于反思型生成范式训练的推理模型XBai o4

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

S.H.I.T

新Claude Managed Agents

诗一

即梦 CLI

同事.skill

ITELLOU

大语言模型

网址

S.H.I.T

新Claude Managed Agents

诗一

即梦 CLI

同事.skill

ITELLOU