大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

研究员改造 OpenAI 开源模型 gpt-oss-20b：移除推理约束，还原 “无对齐” 基础版本

8月初，OpenAI 发布了其首个自 GPT-2 以来的开放权重大语言模型系列 gpt-oss，包含 200 亿（gpt-oss-20b）和 1200 亿（gpt-oss-120b）参数两个版本，采用...

大语言模型 # gpt-oss-20b # gpt-oss-20b-base

6个月前

01550

微软发布rStar2-Agent：14亿参数实现671亿模型性能，数学推理模型迎来“轻量高效”新突破

微软近期推出的rStar2-Agent，以14亿参数的轻量化规模，在数学推理领域实现了突破性进展——它未依赖更长的推理时间，而是通过更智能的思考逻辑，达到了与671亿参数的DeepSeek-R1相当的...

大语言模型 # rStar2-Agent # 微软

6个月前

01910

腾讯优图实验室发布Youtu-agent：开源、高性能的自主智能体框架，开箱即用多场景能力

腾讯优图实验室近期推出了自主智能体框架 Youtu-agent——一款以“灵活、高性能、低成本”为核心的工具，不仅能支持自主智能体的构建、运行与评估，还在多项权威基准测试中表现突出。更重要的是，它针对...

大语言模型 # Youtu-agent # 智能体框架

6个月前

01490

蚂蚁集团新框架Atom-Searcher：用“原子化思想”破解LLMs深度研究难题

大语言模型（LLM）在开放域问答、信息检索等任务中展现出强大潜力。然而，面对需要多步骤推理、工具调用和外部验证的复杂任务，仅靠模型的静态知识和简单提示工程往往力不从心。现有方法如检索增强生成（RAG...

大语言模型 # Atom-Searcher # 蚂蚁集团

6个月前

02960

深度求索发布 DeepSeek-V3.1：混合思考模式 + 128K 上下文，API 同步升级并支持 Anthropic 格式

深度求索（DeepSeek）正式推出 DeepSeek-V3.1 —— 一个在架构设计、推理效率和智能体能力上全面升级的新版本模型。此次更新不仅提升了性能，更引入了混合思考模式，让同一个模型可灵活适应...

大语言模型 # DeepSeek-V3.1 # 深度求索

6个月前

03420

字节跳动 Seed 团队发布 Seed-OSS 系列开源模型：36B 参数，512K 长上下文，可灵活调整思考长度

字节跳动Seed团队正式推出Seed-OSS系列开放权重模型，该系列均为36B参数规模，聚焦长上下文处理、推理能力与代理任务优化，以Apache-2.0许可证开源，为开发者与研究社区提供高实用性工具...

大语言模型 # Seed-OSS # 字节跳动

6个月前

02750

Surya：NASA与IBM联合推出日球物理学AI基础模型，3.66亿参数开源可微调

由NASA、IBM及合作伙伴联合开发的Surya，是全球首个面向日球物理学的开源AI基础模型。该模型拥有3.66亿参数，基于NASA太阳动力学天文台（SDO）9年的多仪器观测数据（约218TB）预训练...

大语言模型 # Surya # 日球物理学

6个月前

02210

OPPO AI实验室推出新范式Chain-of-Agents（CoA）：用于在单个模型中实现多智能体系统的复杂问题解决能力

OPPO AI实验室推出一种新的范式——Chain-of-Agents（CoA），用于在单个模型中实现多智能体系统（Multi-Agent Systems, MAS）的复杂问题解决能力。传统的多智能体...

大语言模型 # Chain-of-Agents # CoA # OPPO AI实验室

6个月前

01440

英伟达推出小型语言模型 Nemotron-Nano-9B-V2：更小、更快、可控制“思考”的AI

当AI模型不再一味追求“更大”，而是转向“更高效”时，小型语言模型（SLM）的时代正悄然到来。继麻省理工学院衍生公司 Liquid AI 推出可在智能手表上运行的视觉模型、谷歌发布手机端运行的轻量级...

大语言模型 # Nemotron-Nano-9B-V2 # 英伟达

6个月前

02480

清华、上交大等团队提出 SSRL：无需外部搜索的强化学习新范式

在当前主流的“代理式搜索”（Agentic Search）系统中，大型语言模型（LLM）通常通过调用外部搜索引擎（如 Google、Bing 或专用 API）来获取实时信息，以回答复杂问题。这一模式虽...

大语言模型 # SSRL # 强化学习

6个月前

01850

谷歌发布 Gemma 3 270M：专为微调而生的超高效小模型

在开源大模型领域持续发力的谷歌，近日为其 Gemma 模型家族再添新成员——Gemma 3 270M。这是一款拥有 2.7 亿参数的紧凑型模型，专为特定任务微调设计，旨在为开发者提供一个高效、节能、生...

大语言模型 # Gemma 3 270M # 小模型 # 谷歌

6个月前

03690

Salesforce 推出 CoAct-1：能写代码的智能体，让自动化迈入新阶段

在AI智能体普遍还在“点击屏幕”完成任务的今天，Salesforce 与南加州大学联合研发的 CoAct-1 正在打破这一局限。这款新型计算机操作智能体不仅能识别界面、模拟鼠标点击，更能在任务执行过程...

大语言模型 # CoAct-1 # 智能体

6个月前

01550

加载更多

研究员改造 OpenAI 开源模型 gpt-oss-20b：移除推理约束，还原 “无对齐” 基础版本

微软发布rStar2-Agent：14亿参数实现671亿模型性能，数学推理模型迎来“轻量高效”新突破

腾讯优图实验室发布Youtu-agent：开源、高性能的自主智能体框架，开箱即用多场景能力

蚂蚁集团新框架Atom-Searcher：用“原子化思想”破解LLMs深度研究难题

深度求索发布 DeepSeek-V3.1：混合思考模式 + 128K 上下文，API 同步升级并支持 Anthropic 格式

字节跳动 Seed 团队发布 Seed-OSS 系列开源模型：36B 参数，512K 长上下文，可灵活调整思考长度

Surya：NASA与IBM联合推出日球物理学AI基础模型，3.66亿参数开源可微调

OPPO AI实验室推出新范式Chain-of-Agents（CoA）：用于在单个模型中实现多智能体系统的复杂问题解决能力

英伟达推出小型语言模型 Nemotron-Nano-9B-V2：更小、更快、可控制“思考”的AI

清华、上交大等团队提出 SSRL：无需外部搜索的强化学习新范式

谷歌发布 Gemma 3 270M：专为微调而生的超高效小模型

Salesforce 推出 CoAct-1：能写代码的智能体，让自动化迈入新阶段

A股智能分析系统

OpenClaw

OpenClaw（Clawdbot/Moltbot）

MimiClaw

Meshy

Moonvalley

大语言模型

网址

A股智能分析系统

OpenClaw

OpenClaw（Clawdbot/Moltbot）

MimiClaw

Meshy

Moonvalley