苹果 & 香港研究人员推出 DiffuCoder:首个面向代码生成的扩散大语言模型近日,苹果与香港的研究团队联合提出了一种全新的基于扩散机制的大语言模型(Diffusion Large Language Model, dLLM)——DiffuCoder,专为代码生成任务设计。 Gi...大语言模型# DiffuCoder# 扩散大语言模型# 苹果6个月前01850
华为正式开源盘古大模型与昇腾推理技术周一,华为宣布一项重大举措:开源其盘古70亿参数(7B)密集模型和720亿参数(72B)Pro MoE混合专家模型,以及基于昇腾平台的高效推理技术。 这一动作被视为华为持续推进大型AI模型研究与产业应...大语言模型# 华为# 盘古大模型6个月前01840
Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型MistralAI宣布推出Mistral Small 3.1,这一新模型在性能和功能上均达到了同级别模型中的顶尖水平。作为Mistral Small 3的升级版本,3.1版本不仅在文本性能和多模态理解...大语言模型# Mistral AI# Mistral Small 3.1# 大语言模型9个月前01810
微软发布rStar2-Agent:14亿参数实现671亿模型性能,数学推理模型迎来“轻量高效”新突破微软近期推出的rStar2-Agent,以14亿参数的轻量化规模,在数学推理领域实现了突破性进展——它未依赖更长的推理时间,而是通过更智能的思考逻辑,达到了与671亿参数的DeepSeek-R1相当的...大语言模型# rStar2-Agent# 微软4个月前01780
清华、普林斯顿等联合推出数学定理证明模型Goedel-Prover-V2:在自动形式化数学证明生成领域树立了新的技术标杆近日,由普林斯顿大学语言与智能实验室、清华大学、英伟达、斯坦福大学、Meta FAIR、亚马逊、上海交通大学和北京大学联合研发的 Goedel-Prover-V2 正式发布。这是一系列开源语言模型,在...大语言模型# Goedel-Prover-V2# 数学定理证明模型5个月前01770
蚂蚁集团新框架Atom-Searcher:用“原子化思想”破解LLMs深度研究难题大语言模型(LLM)在开放域问答、信息检索等任务中展现出强大潜力。然而,面对需要多步骤推理、工具调用和外部验证的复杂任务,仅靠模型的静态知识和简单提示工程往往力不从心。 现有方法如检索增强生成(RAG...大语言模型# Atom-Searcher# 蚂蚁集团4个月前01750
谷歌发布 Gemma 3n:为移动设备而生的高效多模态AI模型继去年首款 Gemma 模型发布以来,Gemmaverse 生态系统迅速壮大,累计下载量突破 1.6亿次,覆盖从安全防护到医疗应用等十余个专业领域。社区创新成果斐然,例如 Roboflow 打造的企业...大语言模型# Gemma 3n# 谷歌6个月前01750
JetBrains推出其首个用于编码的开源模型Mellum,主要功能为代码补全软件开发公司JetBrains,以提供一系列流行应用程序开发工具而闻名,它们在今天发布了其首个用于编码的开源模型——Mellum。这款模型于周三在Hugging Face平台上公开,通过高度专业化的代...大语言模型# JetBrains# 代码模型# 代码补全8个月前01750
Mistral AI宣布推出 Codestral 25.08 和完整的 Mistral 企业编码栈Mistral AI 今日宣布推出 Codestral 25.08,并同步发布其完整的 Mistral 企业编码栈(Mistral Coding Stack for Enterprise)。 这不是一...大语言模型# Codestral 25.08# Mistral AI4个月前01740
RWKV开源社区推出新型序列建模架构及其预训练语言模型 RWKV-7 "Goose"RWKV开源社区推出新型序列建模架构及其预训练语言模型 RWKV-7 "Goose",RWKV-7 是一种基于递归神经网络(RNN)的架构,专为高效处理长序列数据而设计。它在多语言任务上达到了30亿参...大语言模型# Goose# RWKV Runner# RWKV-79个月前01740
Mistral AI 推出 Devstral Medium 以及 Devstral Small 的升级版本Mistral AI 推出了 Devstral Medium 以及 Devstral Small 的升级版本。这些模型由 Mistral AI 与 All Hands AI 合作开发,重点在于对不同提...大语言模型# Devstral Medium# Devstral Small# Mistral AI5个月前01730
HelpingAI 团队推出全球首个支持“中间思维”的AI模型Dhanishtha-2.0想象一个不仅能快速回答问题,还能像人类一样逐步思考、自我反思、甚至中途改变主意的人工智能。这不是科幻场景,而是 Dhanishtha-2.0 带来的现实。 模型:https://huggingface...大语言模型# Dhanishtha-2.0# HelpingAI5个月前01720