PinchTab
PinchTab

PinchTab 最新版

官方版无广告5

PinchTab 是一款基于 Go 语言开发的高性能浏览器自动化桥接器,仅凭 12MB 的独立二进制文件,即可将 Chrome 浏览器转化为 AI 智能体的可控终端,提供极致的令牌效率与稳定的元素操作能力。

更新日期:
2026年3月4日
语言:
中文
平台:

0 人已下载 手机查看

在 AI 智能体(Agent)爆发的今天,如何让大模型精准、高效地控制浏览器执行任务,成为了落地的关键瓶颈。PinchTab 是一款基于 Go 语言开发的高性能浏览器自动化桥接器,仅凭 12MB 的独立二进制文件,即可将 Chrome 浏览器转化为 AI 智能体的可控终端,提供极致的令牌效率与稳定的元素操作能力。

为什么选择 PinchTab?

传统的浏览器自动化工具(如 Selenium、Puppeteer)往往依赖庞大的运行时环境,且在面对动态网页时容易因坐标漂移而失效。PinchTab 专为 AI 驱动 的场景设计:

  • 极致轻量:单文件 12MB,无外部依赖,启动秒级完成。
  • 令牌高效 (Token Efficient):通过智能文本提取与结构化摘要,每个页面仅需约 800 Tokens 即可让 LLM 理解页面结构,大幅降低 API 调用成本。
  • 稳定性优先:摒弃脆弱的 XPath 或屏幕坐标,采用 可访问性树 (Accessibility Tree) 进行元素引用,确保即使页面布局微调,操作依然精准。
  • 多实例并发:支持并行运行多个隔离的 Chrome 进程,每个实例拥有独立配置文件,完美适配多账号、多任务场景。

核心功能亮点

1. 双模控制:CLI 与 HTTP API

  • 命令行交互:通过简单的 CLI 命令即可导航、截图、点击、提取文本,适合脚本快速调试。
  • HTTP API:提供标准的 RESTful 接口,方便任何语言的 AI Agent 集成调用。

2. 高级隐身与配置管理

  • 配置文件持久化:每个实例可绑定独立配置文件(Profile),登录状态永久保存,重启后无需重新认证。
  • 隐身注入:内置高级反检测机制,模拟真实用户行为,降低被网站风控识别的风险。
  • 灵活部署:支持 无头模式 (Headless) 用于服务器后台运行,或 有头模式 (Headed) 用于本地调试与监控。

3. 全平台与架构优化

  • ARM64 原生支持:针对树莓派 (Raspberry Pi) 等 ARM 设备深度优化,自动检测并适配 Chromium,是边缘计算设备的理想选择。
  • 实时仪表板:内置可视化面板,实时监控各实例状态、资源占用及任务进度。

快速开始

安装方式

PinchTab 提供多种便捷的安装途径:

  • macOS / Linux (一键脚本):
    curl -fsSL https://pinchtab.com/install.sh | bash
    
  • npm (Node.js 用户):
    npm install -g pinchtab
    
  • Docker (容器化部署):
    docker run -d -p 9867:9867 pinchtab/pinchtab
    

使用示例

场景:让 AI 智能体访问网页并点击按钮

  1. 启动服务器
    pinchtab
    # 默认监听 http://localhost:9867
    
  2. 创建实例并导航 (HTTP API)
    # 创建一个名为 "work" 的配置文件的实例
    TAB=$(curl -s -X POST http://localhost:9867/instances \
      -d '{"profile":"work"}' | jq -r '.id')
    
    # 导航到目标网站
    curl -X POST "http://localhost:9867/instances/$TAB/nav" \
      -d '{"url":"https://example.com"}'
    
  3. 获取页面快照 (供 LLM 分析)
    # 获取交互式元素的精简快照 (仅消耗少量 Tokens)
    curl "http://localhost:9867/instances/$TAB/snapshot?filter=interactive"
    
  4. 执行操作 (点击元素)
    # 假设 LLM 分析后返回元素引用为 "e5"
    curl -X POST "http://localhost:9867/instances/$TAB/action" \
      -d '{"kind":"click","ref":"e5"}'
    

或使用 CLI 直接操作

pinchtab nav https://example.com
pinchtab snap -i -c  # 获取交互式元素快照
pinchtab click e5    # 点击引用为 e5 的元素
pinchtab text        # 提取页面文本

核心概念解析

  • 实例 (Instance):一个独立运行的 Chrome 进程。你可以同时运行数十个实例,互不干扰。
  • 配置文件 (Profile):浏览器的“身份”。包含 Cookie、LocalStorage、扩展程序等。登录一次,永久有效。
  • 标签页 (Tab):实例中的单个网页。一个实例可管理多个标签页,但推荐一对一以获得最佳隔离性。

应用场景

  • AI 数据抓取:结合 LLM 的理解能力,自适应处理复杂动态网页,提取结构化数据。
  • 自动化测试:利用稳定的元素引用,构建鲁棒的端到端测试流程。
  • RPA 流程自动化:在树莓派等低功耗设备上部署,7x24 小时执行重复性网页任务。
  • 多账号管理:通过多实例与配置文件隔离,安全高效地管理社交媒体、电商等多个账号。

相关软件

Comet

Comet - 最新版

Comet 是 Perplexity 向“下一代浏览器”迈进的第一步。它将 AI 引入浏览器核心体验中,提供更智能的搜索、阅读辅助和任务自动化功能。尽管目前还存在一些限制,如 AI 幻觉、权限敏感性和功能稳定性等问题,但它已经展示了 AI 如何真正融入我们的日常工作流。
BrowserOS

BrowserOS - 最新版

BrowserOS 是基于 Chromium 构建的开源浏览器,专为在本地运行 AI 智能体而设计。它不依赖云端服务,所有数据默认保留在你的设备上,提供了一种隐私优先的替代方案,功能定位接近 Perplexity 的 Comet 或 Dia,但完全由你掌控。

暂无评论

none
暂无评论...