大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型

排序

发布更新浏览点赞

苹果 & 香港研究人员推出 DiffuCoder：首个面向代码生成的扩散大语言模型

近日，苹果与香港的研究团队联合提出了一种全新的基于扩散机制的大语言模型（Diffusion Large Language Model, dLLM）——DiffuCoder，专为代码生成任务设计。 Gi...

6个月前

01850

华为正式开源盘古大模型与昇腾推理技术

周一，华为宣布一项重大举措：开源其盘古70亿参数（7B）密集模型和720亿参数（72B）Pro MoE混合专家模型，以及基于昇腾平台的高效推理技术。这一动作被视为华为持续推进大型AI模型研究与产业应...

大语言模型 # 华为 # 盘古大模型

6个月前

01840

Mistral AI发布开源模型Mistral Small 3.1，号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

MistralAI宣布推出Mistral Small 3.1，这一新模型在性能和功能上均达到了同级别模型中的顶尖水平。作为Mistral Small 3的升级版本，3.1版本不仅在文本性能和多模态理解...

大语言模型 # Mistral AI # Mistral Small 3.1 # 大语言模型

9个月前

01810

微软发布rStar2-Agent：14亿参数实现671亿模型性能，数学推理模型迎来“轻量高效”新突破

微软近期推出的rStar2-Agent，以14亿参数的轻量化规模，在数学推理领域实现了突破性进展——它未依赖更长的推理时间，而是通过更智能的思考逻辑，达到了与671亿参数的DeepSeek-R1相当的...

大语言模型 # rStar2-Agent # 微软

4个月前

01780

清华、普林斯顿等联合推出数学定理证明模型Goedel-Prover-V2：在自动形式化数学证明生成领域树立了新的技术标杆

近日，由普林斯顿大学语言与智能实验室、清华大学、英伟达、斯坦福大学、Meta FAIR、亚马逊、上海交通大学和北京大学联合研发的 Goedel-Prover-V2 正式发布。这是一系列开源语言模型，在...

大语言模型 # Goedel-Prover-V2 # 数学定理证明模型

5个月前

01770

蚂蚁集团新框架Atom-Searcher：用“原子化思想”破解LLMs深度研究难题

大语言模型（LLM）在开放域问答、信息检索等任务中展现出强大潜力。然而，面对需要多步骤推理、工具调用和外部验证的复杂任务，仅靠模型的静态知识和简单提示工程往往力不从心。现有方法如检索增强生成（RAG...

大语言模型 # Atom-Searcher # 蚂蚁集团

4个月前

01750

谷歌发布 Gemma 3n：为移动设备而生的高效多模态AI模型

继去年首款 Gemma 模型发布以来，Gemmaverse 生态系统迅速壮大，累计下载量突破 1.6亿次，覆盖从安全防护到医疗应用等十余个专业领域。社区创新成果斐然，例如 Roboflow 打造的企业...

大语言模型 # Gemma 3n # 谷歌

6个月前

01750

JetBrains推出其首个用于编码的开源模型Mellum，主要功能为代码补全

软件开发公司JetBrains，以提供一系列流行应用程序开发工具而闻名，它们在今天发布了其首个用于编码的开源模型——Mellum。这款模型于周三在Hugging Face平台上公开，通过高度专业化的代...

大语言模型 # JetBrains # 代码模型 # 代码补全

8个月前

01750

Mistral AI宣布推出 Codestral 25.08 和完整的 Mistral 企业编码栈

Mistral AI 今日宣布推出 Codestral 25.08，并同步发布其完整的 Mistral 企业编码栈（Mistral Coding Stack for Enterprise）。这不是一...

大语言模型 # Codestral 25.08 # Mistral AI

4个月前

01740

RWKV开源社区推出新型序列建模架构及其预训练语言模型 RWKV-7 "Goose"

RWKV开源社区推出新型序列建模架构及其预训练语言模型 RWKV-7 "Goose"，RWKV-7 是一种基于递归神经网络（RNN）的架构，专为高效处理长序列数据而设计。它在多语言任务上达到了30亿参...

大语言模型 # Goose # RWKV Runner # RWKV-7

9个月前

01740

Mistral AI 推出 Devstral Medium 以及 Devstral Small 的升级版本

Mistral AI 推出了 Devstral Medium 以及 Devstral Small 的升级版本。这些模型由 Mistral AI 与 All Hands AI 合作开发，重点在于对不同提...

大语言模型 # Devstral Medium # Devstral Small # Mistral AI

5个月前

01730

HelpingAI 团队推出全球首个支持“中间思维”的AI模型Dhanishtha-2.0

想象一个不仅能快速回答问题，还能像人类一样逐步思考、自我反思、甚至中途改变主意的人工智能。这不是科幻场景，而是 Dhanishtha-2.0 带来的现实。模型：https://huggingface...

大语言模型 # Dhanishtha-2.0 # HelpingAI

5个月前

01720

加载更多

苹果 & 香港研究人员推出 DiffuCoder：首个面向代码生成的扩散大语言模型

华为正式开源盘古大模型与昇腾推理技术

Mistral AI发布开源模型Mistral Small 3.1，号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

微软发布rStar2-Agent：14亿参数实现671亿模型性能，数学推理模型迎来“轻量高效”新突破

清华、普林斯顿等联合推出数学定理证明模型Goedel-Prover-V2：在自动形式化数学证明生成领域树立了新的技术标杆

蚂蚁集团新框架Atom-Searcher：用“原子化思想”破解LLMs深度研究难题

谷歌发布 Gemma 3n：为移动设备而生的高效多模态AI模型

JetBrains推出其首个用于编码的开源模型Mellum，主要功能为代码补全

Mistral AI宣布推出 Codestral 25.08 和完整的 Mistral 企业编码栈

RWKV开源社区推出新型序列建模架构及其预训练语言模型 RWKV-7 "Goose"

Mistral AI 推出 Devstral Medium 以及 Devstral Small 的升级版本

HelpingAI 团队推出全球首个支持“中间思维”的AI模型Dhanishtha-2.0

朱雀大模型检测

Fogsight (雾象)

秒哒

Tripo

OiiOii AI

ITELLOU

大语言模型

网址

朱雀大模型检测

Fogsight (雾象)

秒哒

Tripo

OiiOii AI

ITELLOU