
Agent Development Kit (ADK)
Agent Development Kit (ADK) 是一个灵活模块化的框架,专为开发和部署AI智能体而设计。虽然针对Gemini及谷歌生态系统进行了优化,但ADK具备模型无关性、部署无关性,并兼容其他开发框架。
agent-browser 是由 Vercel 开源的一款专为 AI 智能体设计的无头浏览器自动化 CLI 工具,专为 AI 编程助手(如 Claude Code、Cursor、GitHub Copilot、Gemini、CodeWhisperer 等)提供可靠、高效的浏览器自动化能力。它以 AI 友好 为核心设计理念,通过结构化输出和确定性交互,让大模型能稳定地“操作网页”。

可通过 npm 一键安装:
npm install -g agent-browser
snapshot 命令返回带唯一引用标识(如 @e1、@e2)的可访问性树(Accessibility Tree),使 LLM 能精准、可靠地引用页面元素,避免模糊描述导致的操作失败。open, go-back, reload)click, type, hover)fill, select)screenshot)cookies, localStorage)--session)# 打开网页并获取结构化快照
agent-browser open https://example.com
agent-browser snapshot -i
# 输出示例:
# - 标题 "Example Domain" [ref=e1]
# - 链接 "More information..." [ref=e2]
# 通过引用标识精准点击
agent-browser click @e2
# 截图保存
agent-browser screenshot page.png
# 关闭当前会话
agent-browser close
传统自动化依赖 XPath 或 CSS 选择器,但这些对 LLM 来说难以生成且易失效。agent-browser 采用 快照 + 引用标识 的机制:
@eX 唯一对应快照中的一个 DOM 元素@e2,即可完成后续操作,大幅降低出错率采用 客户端-守护进程 模式,兼顾速度与稳定性:
| 平台 | 架构 | 二进制支持 |
|---|---|---|
| macOS | ARM64 / x64 | ✅ |
| Linux | ARM64 / x64 | ✅ |
| Windows | x64 | ✅ |







