大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

SEARCH-R1：通过强化学习让 LLM 在逐步推理过程中自主生成多个搜索查询，并实时检索信息

伊利诺伊大学厄巴纳-香槟分校计算机科学系和马萨诸塞大学安姆赫斯特分校智能信息检索中心的研究人员推出新型框架SEARCH-R1 ，通过强化学习（ RL）训练大语言模型，使其能够在推理过程中自主生成搜索查...

大语言模型 # DeepSeek-R1 # SEARCH-R1

11个月前

03310

阿里Qwen团队推出强化学习增强的推理模型QwQ-32B

阿里云的Qwen团队最近宣布了一项重要进展，他们通过整合大规模强化学习（RL）技术来提升大语言模型的智能水平，并推出了新的推理模型QwQ-32B。这款拥有320亿参数的模型，在性能上能够与具有6710...

大语言模型 # Qwen # QwQ-32B # 强化学习

11个月前

03250

阿里通义团队开源了其最新代码模型Qwen2.5-Coder系列，代码能力比肩 GPT4o 和 Claude 3.5 Sonnet

阿里通义团队开源了其最新代码模型Qwen2.5-Coder，这是一个从其前身CodeQwen1.5显著升级的代码特定模型系列，这个系列包括六个模型：Qwen2.5-Coder-(0.5B/1.5B/3...

大语言模型 # Qwen2.5-Coder # 代码模型 # 阿里通义

12个月前

03240

Jina AI推出一款1.5B参数的小型语言模型ReaderLM-v2：专注于将原始HTML高效准确地转换为Markdown或JSON格式

ReaderLM-v2 是由Jina AI开发的一款1.5B参数的小型语言模型，专注于将原始HTML高效准确地转换为Markdown或JSON格式。这款第二代模型在长上下文处理能力和多语言支持方面有了...

大语言模型 # ReaderLM-v2

12个月前

03230

Anthropic发布 Claude Opus 4.1：代理任务、现实世界编码和推理的升级

Anthropic今天发布了 Claude Opus 4.1，这是对 Claude Opus 4 在代理任务、现实世界编码和推理方面的升级。我们计划在未来几周发布对模型的更大改进。 Claude Op...

大语言模型 # Anthropic # Claude Opus 4.1

6个月前

03180

EleutherAI 发布首个大规模许可训练数据集 The Common Pile v0.1

近日，开源人工智能研究组织 EleutherAI 正式发布了名为 The Common Pile v0.1 的全新训练数据集。该数据集据称是目前用于训练 AI 模型的最大合法授权+公共领域文本集合之一...

大语言模型 # EleutherAI # The Common Pile v0.1 # 数据集

8个月前

03150

通义 DeepResearch：首个全开源 Web Agent，性能对标 OpenAI 深度研究模型

阿里通义实验室正式发布 Tongyi DeepResearch —— 一个在性能上可与当前最先进闭源系统相媲美的全开源 Web Agent。项目主页：https://tongyi-agent.git...

大语言模型 # Tongyi DeepResearch # 深度研究模型

5个月前

03130

中国科学院发布“磐石”操作系统与 S1-Base 科学大模型：开启“AI for Science”新范式

在AI加速推动科学研究变革的背景下，中国科学院正式推出 “磐石”（ScienceOne） —— 一个面向前沿科学发现与技术创新的“AI+科学”操作系统。作为其核心引擎，磐石科学基础大模型（S1-Bas...

大语言模型 # 中国科学院 # 磐石科学基础大模型

6个月前

03120

Sakana AI 推出 AB-MCTS：让多个前沿模型协作解决复杂推理问题

Sakana AI 发布了一项令人瞩目的研究成果：他们开发出一种名为 AB-MCTS（自适应分支蒙特卡洛树搜索）的新算法。该算法在 ARC-AGI-2 基准测试中表现出色，显著优于单独使用 o4-m...

大语言模型 # AB-MCTS # Sakana AI

7个月前

03110

Kurma AI专为水产养殖领域打造的通用语言模型AQUA-7B和AQUA-1B：以生成式 AI 重塑美国水产养殖业

美国拥有广阔的海岸线、纯净的水域资源以及领先的技术基础，具备发展高产、可持续水产养殖业的天然优势。然而，这一潜力远未被充分挖掘。据2021年数据显示，美国人均海产品消费量已达约 20.5磅，其中 8...

大语言模型 # AQUA-1B # AQUA-7B # Kurma AI

7个月前

03100

昆仑万维开源代码模型 Skywork-SWE-32B：用消费级显卡部署 AI 工程师的新可能

今天，昆仑万维正式宣布开源其最新推出的代码智能体 Skywork-SWE-32B，该模型专为软件工程（SWE）任务设计，在 SWE-bench Verified 基准测试中达到 38.0% 的 pas...

大语言模型 # Skywork-SWE-32B # 代码模型 # 昆仑万维

7个月前

03100

无损压缩框架DFloat11：可将大语言模型的规模缩小约 30%，同时保持与原始模型完全一致的逐位相同输出

DFloat11 是一个无损压缩框架，可将大语言模型（LLM）的规模缩小约 30%，同时保持与原始模型完全一致的逐位相同输出。它支持在资源受限的硬件上进行高效的 GPU 推理，且不牺牲准确性。 Git...

大语言模型 # DFloat11 # 无损压缩框架

9个月前

03100

加载更多

SEARCH-R1：通过强化学习让 LLM 在逐步推理过程中自主生成多个搜索查询，并实时检索信息

阿里Qwen团队推出强化学习增强的推理模型QwQ-32B

阿里通义团队开源了其最新代码模型Qwen2.5-Coder系列，代码能力比肩 GPT4o 和 Claude 3.5 Sonnet

Jina AI推出一款1.5B参数的小型语言模型ReaderLM-v2：专注于将原始HTML高效准确地转换为Markdown或JSON格式

Anthropic发布 Claude Opus 4.1：代理任务、现实世界编码和推理的升级

EleutherAI 发布首个大规模许可训练数据集 The Common Pile v0.1

通义 DeepResearch：首个全开源 Web Agent，性能对标 OpenAI 深度研究模型

中国科学院发布“磐石”操作系统与 S1-Base 科学大模型：开启“AI for Science”新范式

Sakana AI 推出 AB-MCTS：让多个前沿模型协作解决复杂推理问题

Kurma AI专为水产养殖领域打造的通用语言模型AQUA-7B和AQUA-1B：以生成式 AI 重塑美国水产养殖业

昆仑万维开源代码模型 Skywork-SWE-32B：用消费级显卡部署 AI 工程师的新可能

无损压缩框架DFloat11：可将大语言模型的规模缩小约 30%，同时保持与原始模型完全一致的逐位相同输出

Clawdbot/Moltbot

Higgsfield AI

Situation Monitor

Fogsight (雾象)

CivitAI

ITELLOU

大语言模型

网址

Clawdbot/Moltbot

Higgsfield AI

Situation Monitor

Fogsight (雾象)

CivitAI

ITELLOU