如果你正在构建能够“真正使用计算机”的大语言模型(LLM)智能体,那么你可能已经意识到:仅靠代码解释器远远不够。
EdgeBox 正是为此而生——一个功能完整、支持图形界面的本地 LLM 智能体沙箱,它将云端的执行能力带入你的桌面,在保障隐私的同时,赋予 AI 真正的“数字工作者”行为能力。

基于开源项目 E2B 的理念,EdgeBox 将其核心能力重构为纯本地运行环境,所有数据和操作均保留在你的机器上,不受网络传输或第三方服务影响。
更重要的是,EdgeBox 是目前极少数同时提供 CLI 命令行 + GUI 图形桌面 双模式支持的本地沙箱工具,让 AI 不再只是“写代码”,而是可以像人类一样操作浏览器、编辑文档、点击按钮、截取屏幕。
为什么 EdgeBox 不同?
大多数开源沙箱项目(如 codebox)仅提供命令行接口,AI 的交互范围被限制在终端内。而 EdgeBox 的目标是实现真正的 Computer Use(计算机使用)。
| 特性 | EdgeBox | 其他开源沙箱 |
|---|---|---|
| 运行环境 | 🖥️ 本地 | 🖥️ 本地 |
| 用户界面 | ✅ GUI + CLI | ❌ 仅 CLI |
| 核心能力 | 计算机使用 + 代码解释 | 仅代码解释 |
| 数据隐私 | ✅ 100% 私有 | ✅ 100% 私有 |
| 执行延迟 | ⚡️ 接近零 | ⚡️ 接近零 |
| 集成协议 | ✅ MCP 协议 | 专有 API |
✅ 关键优势:通过 MCP 协议标准化接入,支持任意兼容客户端
核心功能:三大模块赋能 AI 智能体
EdgeBox 通过 MCP(Model Context Protocol) 暴露其全部功能,组织为三个核心模块,供 LLM 客户端调用。
1. 💻 完整桌面环境(GUI 模式)
这是 EdgeBox 最具突破性的部分——它内置了一个可通过 VNC 查看的 Ubuntu 桌面环境,让你的 AI 能“看见”并操作图形界面。
- 预装常用应用:Google Chrome、VS Code、文件管理器等开箱即用
- 视觉感知能力:通过
desktop_screenshot获取当前画面,使 AI 可根据 UI 内容决策 - GUI 自动化:
- 控制鼠标移动、点击、拖拽
- 模拟键盘输入与快捷键组合(Ctrl+C / Alt+Tab)
- 管理窗口状态(最小化、最大化、切换)
这意味着你可以下达如下指令:
“打开浏览器,登录我的 GitHub 账户,搜索 ‘EdgeBox’,找到仓库主页并截图。”
AI 将自动完成整个流程,就像你在亲自操作。

2. 🐚 完整的代码解释器 & Shell 环境
对于传统任务,EdgeBox 同样提供了强大的命令行支持。
- 安全隔离:每个会话运行在独立的 Docker 容器中
- 多语言支持:Python、JavaScript/TypeScript、R、Java、Bash 等
- 持久化 Shell:支持有状态的 bash 终端,变量和路径跨命令保留
- 文件系统操作:完整支持文件的创建、读取、写入、删除与监控
典型应用场景包括数据分析、脚本编写、自动化测试等。
3. 🔗 无缝集成 LLM 客户端(MCP 支持)
EdgeBox 的所有功能都通过标准 MCP HTTP 接口暴露,无需适配即可连接主流 LLM 工具。
支持的客户端示例:
- Claude Desktop
- OpenWebUI
- LobeChat
- Anything LLM
- 自定义 MCP 实现
多会话管理:
通过请求头中的 x-session-id,可轻松创建多个隔离的沙箱实例,用于并发处理不同任务。
{
"mcpServers": {
"edgebox-default": {
"url": "http://localhost:8888/mcp"
},
"edgebox-data-analysis": {
"url": "http://localhost:8888/mcp",
"headers": { "x-session-id": "data-analysis" }
},
"edgebox-web-scraping": {
"url": "http://localhost:8888/mcp",
"headers": { "x-session-id": "web-scraping" }
}
}
}
每个会话拥有独立的文件系统和运行环境,互不干扰。
MCP 工具列表
EdgeBox 提供两类 MCP 工具,可根据需求启用或禁用。
📟 核心工具(CLI 模式|始终可用)
| 工具名 | 功能说明 |
|---|---|
execute_python | 执行 Python 代码 |
execute_typescript | 执行 TypeScript/JavaScript |
execute_r | 执行 R 语言脚本 |
execute_java | 执行 Java 程序 |
execute_bash | 运行 Bash 命令 |
shell_run | 执行有状态 Shell 命令 |
shell_run_background | 后台运行进程 |
fs_list | 列出目录内容 |
fs_read | 读取文件 |
fs_write | 写入文件 |
fs_info | 获取文件元信息 |
fs_watch | 监控目录变化 |
🖱️ 桌面工具(GUI 模式|需手动启用)
⚠️ 仅当在设置中开启“GUI 工具”后可用
| 工具名 | 功能说明 |
|---|---|
desktop_mouse_click | 鼠标单击(左/右/中键) |
desktop_mouse_double_click | 双击 |
desktop_mouse_move | 移动光标到指定坐标 |
desktop_mouse_drag | 拖拽操作 |
desktop_mouse_scroll | 滚轮滚动 |
desktop_keyboard_type | 输入文本(支持中文) |
desktop_keyboard_press | 按下单个按键 |
desktop_keyboard_combo | 快捷键组合(Ctrl+S 等) |
desktop_get_windows | 获取当前所有窗口 |
desktop_switch_window | 切换焦点窗口 |
desktop_maximize_window | 最大化窗口 |
desktop_minimize_window | 最小化窗口 |
desktop_resize_window | 调整窗口尺寸 |
desktop_screenshot | 截取桌面图像(PNG) |
desktop_launch_app | 启动应用程序 |
desktop_wait | 添加延迟等待 |
技术架构概览
[LLM 智能体]
↓ (MCP over HTTP)
[EdgeBox 应用]
↓ (Docker API)
[隔离的 Docker 容器(含 Ubuntu 桌面 + Shell)]
- 前端框架:Electron + React + TypeScript + Tailwind CSS
- UI 组件库:Radix UI
- 后端运行时:Node.js
- 容器管理:Dockerode(对接 Docker API)
- 容器引擎:Docker Desktop(必须安装)
整个系统轻量高效,资源占用可控,适合长期驻留后台运行。
使用准备与安装指南
📋 前置要求
- ✅ Docker Desktop 已安装并正常运行(Windows / macOS / Linux)
- ✅ 至少 4GB 可用内存(建议 8GB 以上)
🛠️ 安装步骤
- 访问 EdgeBox 发布页,下载对应平台的最新版本
- 安装并启动 Docker Desktop
- 启动 EdgeBox 应用:
- Windows:双击
EdgeBox.exe - macOS:打开
EdgeBox.app - Linux:运行
.AppImage或安装.deb/.rpm包
- Windows:双击
🎯 快速开始
- 启动 EdgeBox,确认仪表板显示 Docker 和 MCP 服务已就绪
- 在你的 LLM 客户端中添加 MCP 配置:
{
"mcpServers": {
"edgebox": {
"url": "http://localhost:8888/mcp"
}
}
}
- 开始下达自然语言指令,例如:
“帮我分析 data.csv 文件,画出销售额趋势图。”
“打开浏览器,搜索‘如何部署 FastAPI’,并将前三个结果保存为 PDF。”
“创建一个 Python 项目,初始化 git,提交初始版本。”
AI 将通过 EdgeBox 自主完成这些任务。
🔐 安全设计
尽管运行在本地,EdgeBox 仍采用多重防护机制确保安全:
- 容器隔离:每个会话运行在独立的 Docker 容器中,无法访问主机敏感路径
- 资源限制:可配置 CPU、内存上限,防止资源耗尽
- 网络控制:默认情况下容器网络受限,可按需开放外网访问
- 无外部依赖:所有组件均本地运行,不回传任何用户数据















