OPPO 发布 OAgents：一个模块化、可复现的基础智能体框架

170 0

随着“智能体（Agentic AI）”成为 AI 发展的重要方向，各类框架层出不穷。然而，当前研究普遍存在评估标准不一、实现细节不透明、结果难以复现等问题，导致不同系统之间缺乏公平比较的基础。

为应对这一挑战，OPPO 研究团队开展了一项系统性研究，聚焦于智能体框架中的关键设计选择。基于在 GAIA 和 BrowseComp 两大权威基准上的实证分析，团队提出了一套稳健的评估协议，识别出影响智能体性能的核心组件，并在此基础上开发并开源了 OAgents —— 一个模块化、高性能的基础智能体框架。

GitHub：https://github.com/OPPO-PersonalAI/OAgents

OAgents 在多个基准测试中实现了开源项目中的最优性能，旨在为智能体 AI 的可复现研究与技术演进提供可靠基础。

为什么需要 OAgents？

当前的智能体研究常陷入“黑箱式创新”：新方法宣称性能提升，但缺乏对组件作用的消融分析，也未统一评估流程。这使得：

难以判断性能提升来自架构创新还是调参技巧；
不同框架间无法横向对比；
社区难以在其基础上迭代。

OAgents 的目标不是追求短期榜单领先，而是构建一个可分析、可扩展、可复现的实验平台。它从底层设计上支持对规划、记忆、工具使用等模块的独立替换与评估，推动智能体研究从“拼装式创新”走向“科学化演进”。

核心设计：我们改了什么？

在构建 OAgents 的过程中，团队对现有智能体范式进行了多项关键修改，以提升系统性能与研究可解释性。

🔄 架构重构：模块化与可配置性

我们重新设计了智能体的核心组件，使其高度模块化：

内存系统：支持短期记忆、长期记忆、记忆总结与向量化检索，可根据任务需求灵活组合。
规划引擎：支持多种规划策略（如 ReAct、Tree-of-Thought、Iterative Planning），并能根据任务复杂度动态调整计划粒度。

这种设计允许研究者系统性地评估不同架构对性能的影响，而非整体替换。

🛠️ 工具优化：增强外部知识利用能力

我们重点优化了“搜索智能体”模块，提升其信息获取与处理能力：

多源检索：集成 Google、Bing、Wayback Machine 等多个搜索引擎，提升信息覆盖广度；
查询优化：通过语义重写与关键词提取，提升检索精度；
极简浏览架构：仅提取网页关键内容，减少噪声干扰，提升解析效率。

这些改进显著增强了智能体在开放域任务中的表现。

⏱️ 测试时扩展（Test-Time Scaling）：提升推理鲁棒性

为减少单次推理的随机性与错误，我们引入多种测试时优化策略：

重复推理：对同一任务多次生成响应；
多数投票：对结构化输出（如分类、选择）进行投票决策；
一致性过滤：仅保留多次推理中一致的结果。

这些策略在不改变模型参数的前提下，有效提升了决策的稳定性与准确性。

主要功能

功能	说明
多模态工具集成	支持文本、语音、图像、视频输入，通过语义嵌入而非简单文本化描述，提升跨模态理解能力
优化的搜索智能体	多源检索 + 查询优化 + 轻量级网页解析，提升信息获取效率
动态规划生成	根据任务复杂度自动分解为子任务，并结合历史经验提示优化决策路径
记忆增强系统	支持短期记忆缓存、长期记忆存储与向量检索，提升上下文持续性
测试时扩展支持	内置多样性生成、投票聚合与一致性验证机制，提升输出可靠性