大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Hugging Face发布SmolLM3：3B 级全能小模型，支持推理/非推理双模式与 128k 上下文

随着边缘计算和本地部署需求的增长，小型语言模型（Small Language Model, SLM）正在成为新一代 AI 应用的关键组成部分。近日，Hugging Face 推出了其最新力作 —— ...

8个月前

01010

Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B：实现 93% 准确率，无需昂贵微调

在 LLM（大语言模型）应用场景日益复杂的背景下，如何将用户查询智能路由到最合适的模型，成为提升效率和体验的关键挑战。近日，Katanemo Labs 推出了一个创新的解决方案 —— Arch-Ro...

大语言模型 # Arch-Router-1.5B # 路由模型

8个月前

01490

阿里通义实验室开源 WebSailor，登顶 BrowseComp 榜单的网络智能体

近日，阿里云通义实验室正式开源了一款名为 WebSailor 的新型网络智能体（Web Agent），它具备强大的多步推理与信息检索能力，在高难度网页导航任务中表现出色。 GitHub：https...

大语言模型 # WebSailor # 网络智能体 # 阿里通义实验室

8个月前

02420

MemOS：为大语言模型设计的长期记忆操作系统

MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型（LLMs）设计的长期记忆操作系统。项目主页：https...

大语言模型 # MemOS # 大语言模型

8个月前

05070

华为正式开源盘古大模型与昇腾推理技术

周一，华为宣布一项重大举措：开源其盘古70亿参数（7B）密集模型和720亿参数（72B）Pro MoE混合专家模型，以及基于昇腾平台的高效推理技术。这一动作被视为华为持续推进大型AI模型研究与产业应...

大语言模型 # 华为 # 盘古大模型

8个月前

01970

Sakana AI 推出 AB-MCTS：让多个前沿模型协作解决复杂推理问题

Sakana AI 发布了一项令人瞩目的研究成果：他们开发出一种名为 AB-MCTS（自适应分支蒙特卡洛树搜索）的新算法。该算法在 ARC-AGI-2 基准测试中表现出色，显著优于单独使用 o4-m...

大语言模型 # AB-MCTS # Sakana AI

8个月前

03170

Kurma AI专为水产养殖领域打造的通用语言模型AQUA-7B和AQUA-1B：以生成式 AI 重塑美国水产养殖业

美国拥有广阔的海岸线、纯净的水域资源以及领先的技术基础，具备发展高产、可持续水产养殖业的天然优势。然而，这一潜力远未被充分挖掘。据2021年数据显示，美国人均海产品消费量已达约 20.5磅，其中 8...

大语言模型 # AQUA-1B # AQUA-7B # Kurma AI

8个月前

03370

德国科技咨询公司TNG发布全新 DeepSeek R1-0528 变体DeepSeek-TNG R1T2 Chimera，速度提升 200%

距离中国 AI 初创公司 DeepSeek 发布其热门开源模型 DeepSeek-R1-0528 不到两个月，该模型因其低成本训练和高性能推理能力迅速风靡全球 AI 社区。如今，这款强大模型已被广泛...

大语言模型 # DeepSeek-R1-0528 # DeepSeek-TNG R1T2 Chimera # TNG

8个月前

02370

苹果 & 香港研究人员推出 DiffuCoder：首个面向代码生成的扩散大语言模型

近日，苹果与香港的研究团队联合提出了一种全新的基于扩散机制的大语言模型（Diffusion Large Language Model, dLLM）——DiffuCoder，专为代码生成任务设计。 Gi...

大语言模型 # DiffuCoder # 扩散大语言模型 # 苹果

8个月前

01890

HelpingAI 团队推出全球首个支持“中间思维”的AI模型Dhanishtha-2.0

想象一个不仅能快速回答问题，还能像人类一样逐步思考、自我反思、甚至中途改变主意的人工智能。这不是科幻场景，而是 Dhanishtha-2.0 带来的现实。模型：https://huggingface...

大语言模型 # Dhanishtha-2.0 # HelpingAI

7个月前

01930

百度开源 ERNIE 4.5：覆盖 0.3B 到 424B 参数的大型语言模型系列

百度正式开源了其最新的 ERNIE 4.5 系列，这是继 ERNIE 系列之后又一重磅发布的基础语言模型家族。该系列包含 10 款不同规模与架构的模型，从仅 0.3B（十亿）参数的小型密集模型到高达...

大语言模型 # ERNIE 4.5 # 百度

8个月前

03240

谷歌发布 Gemma 3n：为移动设备而生的高效多模态AI模型

继去年首款 Gemma 模型发布以来，Gemmaverse 生态系统迅速壮大，累计下载量突破 1.6亿次，覆盖从安全防护到医疗应用等十余个专业领域。社区创新成果斐然，例如 Roboflow 打造的企业...

大语言模型 # Gemma 3n # 谷歌

8个月前

01780

加载更多

Hugging Face发布SmolLM3：3B 级全能小模型，支持推理/非推理双模式与 128k 上下文

Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B：实现 93% 准确率，无需昂贵微调

阿里通义实验室开源 WebSailor，登顶 BrowseComp 榜单的网络智能体

MemOS：为大语言模型设计的长期记忆操作系统

华为正式开源盘古大模型与昇腾推理技术

Sakana AI 推出 AB-MCTS：让多个前沿模型协作解决复杂推理问题

Kurma AI专为水产养殖领域打造的通用语言模型AQUA-7B和AQUA-1B：以生成式 AI 重塑美国水产养殖业

德国科技咨询公司TNG发布全新 DeepSeek R1-0528 变体DeepSeek-TNG R1T2 Chimera，速度提升 200%

苹果 & 香港研究人员推出 DiffuCoder：首个面向代码生成的扩散大语言模型

HelpingAI 团队推出全球首个支持“中间思维”的AI模型Dhanishtha-2.0

百度开源 ERNIE 4.5：覆盖 0.3B 到 424B 参数的大型语言模型系列

谷歌发布 Gemma 3n：为移动设备而生的高效多模态AI模型

YouMind

A股智能分析系统

OpenClaw（Clawdbot/Moltbot）

OpenClaw

OpenCloud

NanoClaw

大语言模型

网址

YouMind

A股智能分析系统

OpenClaw（Clawdbot/Moltbot）

OpenClaw

OpenCloud

NanoClaw