
当前,AI 代理与网页交互的方式大多依赖于“模拟人类行为”:通过分析页面截图来识别按钮,再尝试模拟鼠标点击或键盘输入。这种方式不仅速度慢、效率低,而且极易因页面布局微小变动而失败。

WebMCP(Web Model Context Protocol) 是一个新兴的 JavaScript 接口,允许 Web 开发者将自己应用的核心功能,以结构化的方式直接“暴露”给 AI 代理。
核心思想:从“猜”到“调用”
WebMCP 的核心理念是,网站不再只是一个需要被“观察”和“猜测”的视觉界面,而是一个可以被 AI 直接调用的功能集合。开发者可以通过 JavaScript 或 HTML,在页面上明确声明哪些操作是可用的“工具”(tools)。
每个工具都附带:
- 自然语言描述:清晰说明该工具的功能。
- 结构化 JSON Schema:精确定义其输入参数和输出格式。
有了这些信息,AI 代理无需再费力解析 DOM 或定位按钮,而是可以直接像调用一个函数一样,执行“提交订单”、“搜索内容”或“更新用户资料”等逻辑操作。
如何工作?
集成了 WebMCP 的网页,其前端本身就可以充当一个 模型上下文协议(MCP)。它利用浏览器原生的 API(如 navigator.modelContext),在客户端将应用逻辑封装为可供 AI 调用的服务。
这使得用户和 AI 代理能够在同一个 Web 界面中高效协作:AI 利用开发者提供的精确工具来完成任务,而用户则始终保有对操作的完全控制权和共享的上下文感知。
现状与未来
目前,WebMCP 规范正处于积极开发阶段,由 W3C Web Machine Learning 社区等组织孵化。开发者已经可以在 Chrome 浏览器的早期版本中体验这一前沿技术。
对于 Web 开发者而言,WebMCP 代表了一个重要的机会:通过几行代码,就能让你的网站从“被动的展示层”升级为“主动的智能协作平台”,为未来的 AI 优先网络生态做好准备。
数据统计
相关导航


Pixelle MCP

ContextForge MCP Gateway

MCP Filesystem Server

VibeVideo-MCP

UltraRAG

Klavis AI






