Jan-v1 发布:一个专为本地搜索与深度推理优化的 4B 级开源模型在 AI 搜索领域,闭源商业产品长期占据主导地位。而今天,开源社区迎来了一位强有力的挑战者——Jan-v1。 作为 Jan 模型家族的首个正式版本,Jan-v1 基于 Qwen3-4B-Thinkin...大语言模型# Jan-v1# 搜索5个月前03500
快手Klear项目组推出推理模型 Klear-Reasoner:结合长链推理监督微调和梯度保留剪辑策略优化来提升模型在数学和编程任务中的推理能力快手Klear项目组推出推理模型 Klear-Reasoner,它通过结合长链推理(Long Chain-of-Thought, Long CoT)监督微调和梯度保留剪辑策略优化(Gradient-P...大语言模型# Klear-Reasoner# 快手5个月前01750
百川智能发布 Baichuan-M2:小模型,大医疗,单卡可部署的开源医疗大模型8 月 6 日,OpenAI 开源两款大模型,主打“低成本部署”与“医疗能力突破”。仅仅五天后,百川智能推出 Baichuan-M2 ——一款在更小参数规模下实现医疗能力反超的开源模型。 模型:htt...大语言模型# Baichuan-M2# 医疗大模型# 百川智能5个月前05820
阿里发布 Qwen3-4B 双模型:小参数,大能力,原生支持 256K 上下文在大模型“军备竞赛”愈演愈烈的今天,阿里巴巴通义实验室反其道而行之,推出两款 40 亿参数级别 的小型语言模型: Qwen3-4B-Instruct-2507:面向多语言、高响应速度的通用指令模型 Q...大语言模型# Qwen3-4B-Instruct-2507# Qwen3-4B-Thinking-2507# 通义实验室5个月前03940
SWE-Swiss-32B 发布:一个在软件修复任务上达到顶尖水平的 32B 开源模型由北京大学、字节跳动 SEED 团队与香港大学联合研发的 SWE-Swiss-32B 正式亮相。 该模型在 SWE-bench Verified 基准测试中取得 60.2% 的通过率,不仅在同规模开源...大语言模型# SWE-Swiss# SWE-Swiss-32B5个月前04590
OpenAI 发布 GPT-5:更智能、更诚实、更实用的统一模型OpenAI在今天发布了其最新模型GPT-5,这是它们迄今为止最智能、快速和实用的模型,内置思考能力,将专家级智能赋予每个人。(官方博文介绍) OpenAI隆重推出 GPT-5,这是penAI迄今最好...大语言模型# GPT-5# OpenAI5个月前02600
Intelligent Internet 发布两款新型搜索推理模型:II-Search-4B 与 II-Search-CIR 4BIntelligent Internet(II)正式推出两款专注于信息检索与复杂推理的开源语言模型: II-Search-4B:面向多跳检索与事实验证的高效4B级模型 II-Search-CIR 4B...大语言模型# II-Search-4B# II-Search-CIR 4B# Intelligent Internet5个月前02110
Anthropic发布 Claude Opus 4.1:代理任务、现实世界编码和推理的升级Anthropic今天发布了 Claude Opus 4.1,这是对 Claude Opus 4 在代理任务、现实世界编码和推理方面的升级。我们计划在未来几周发布对模型的更大改进。 Claude Op...大语言模型# Anthropic# Claude Opus 4.15个月前03030
OpenAI 发布两款高性能模型免费可商用开源大模型gpt-oss-120b 与 gpt-oss-20b,在本地运行接近 o4-mini 的模型OpenAI 今日正式发布两款开放权重语言模型:gpt-oss-120b 和 gpt-oss-20b。 这是自 GPT-2 以来,OpenAI 首次向公众开放其语言模型权重,标志着公司在开放性与透明度...大语言模型# gpt-oss-120b# gpt-oss-20b# OpenAI5个月前01560
Mistral AI宣布推出 Codestral 25.08 和完整的 Mistral 企业编码栈Mistral AI 今日宣布推出 Codestral 25.08,并同步发布其完整的 Mistral 企业编码栈(Mistral Coding Stack for Enterprise)。 这不是一...大语言模型# Codestral 25.08# Mistral AI5个月前01810
Deep Cogito发布Cogito v2 预览版:从“思考更多”到“直觉更强”的推理范式跃迁Deep Cogito 今日正式发布 Cogito v2 预览版,推出四款开源混合推理模型: 70B 密集型 109B MoE 405B 密集型 671B MoE 其中,671B MoE 是当前全球最...大语言模型# Cogito v2# Deep Cogito5个月前03980
腾讯混元发布四款小尺寸开源模型,端侧 AI 应用迎来新选择继此前开源大尺寸模型后,腾讯混元团队近日推出四款全新小尺寸开源模型,参数量分别为 0.5B、1.8B、4B 和 7B。这些模型专为低功耗、资源受限场景设计,可在消费级显卡、笔记本电脑、手机、智能座舱及...大语言模型# 腾讯混元5个月前03690