Nanobrowser 是一款开源的 AI 网页自动化工具,直接在您的浏览器中运行。这是一款开源版OpenAI Operator,提供灵活的 LLM(大语言模型)选项和多代理系统。Nanobrowser 的多代理系统能够实时分析 HuggingFace,Planner 在遇到障碍时智能自我纠正,并动态指导 Navigator 调整策略——所有操作都在您的浏览器本地运行。

Nanobrowser:强大的开源 AI 网页自动化工具
Nanobrowser 采用浏览器扩展的方式,支持用户使用自己的 LLM API,基于多智能体架构,包括 Planner(规划者)、Navigator(导航者)和 Validator(验证者)。这些智能体协同工作,能够理解并执行复杂的网页任务:Planner 负责制定策略,Navigator 执行网页导航和操作,Validator 则验证任务是否成功完成。
为什么选择 Nanobrowser?
如果您正在寻找一个强大的 AI 网页代理,但不想支付 OpenAI Operator 每月 200 美元的费用,Nanobrowser 是您的理想选择。作为 Chrome 扩展,它提供高端网页自动化功能,同时让您完全掌控:
- 100% 免费:无订阅费或隐藏成本。只需安装并使用您自己的 API 密钥,您只需为您使用的部分付费。
- 注重隐私:所有操作在您的本地浏览器中运行。您的凭据始终归您所有,不会与任何云服务共享。
- 灵活的 LLM 选项:连接您喜欢的 LLM 提供商,自由为不同代理选择不同模型。
- 完全开源:浏览器自动化的过程完全透明,没有黑盒或隐藏流程。
目前,Nanobrowser 支持 OpenAI、Anthropic 和 Gemini,更多 LLM 集成即将推出。
主要功能
- 多代理系统:专业 AI 代理协作完成复杂的网页工作流程。
- 交互式侧边栏:直观的聊天界面,实时状态更新。
- 任务自动化:无缝自动化跨网站的重复网页任务。
- 后续问题:对已完成任务提出上下文相关的后续问题。
- 对话历史:轻松访问和管理您的 AI 代理交互记录。
- 多 LLM 支持:连接您喜欢的 LLM 提供商并为不同代理分配不同模型。
快速入门
下载
从官方 Github 发布页面 下载最新的 nanobrowser.zip
文件。
安装
- 解压
nanobrowser.zip
文件。 - 在 Chrome 中打开
chrome://extensions/
。 - 启用开发者模式(右上角)。
- 点击“加载未打包扩展”(左上角)。
- 选择解压后的
nanobrowser
文件夹。
配置代理模型
- 点击工具栏中的 Nanobrowser 图标以打开侧边栏。
- 点击设置图标(右上角)。
- 添加您的 LLM API 密钥。
- 选择不同代理(Navigator、Planner、Validator)使用的模型。
推荐配置
Nanobrowser 允许您为每个代理配置不同的 LLM 模型,以平衡性能和成本。以下是推荐配置:
更好性能
- Planner & Validator:Claude 3.7 Sonnet
- 更强的推理和规划能力
- 更可靠的任务验证
- Navigator:Claude 3.5 Haiku
- 高效处理网页导航任务
- 性能与成本的良好平衡
成本效益配置
- Planner & Validator:Claude Haiku 或 GPT-4o
- 成本较低的合理性能
- 复杂任务可能需要更多迭代
- Navigator:Gemini 2.0 Flash 或 GPT-4o-mini
- 轻量且成本效益高
- 适合基本导航任务
注意:成本效益配置可能会产生不够稳定的输出,复杂任务可能需要更多迭代。