Wasm-Agents

8个月前发布 139 00

由 Mozilla AI 推出的 Wasm-Agents Blueprint，正在探索一种全新的 AI 代理部署方式 —— 在浏览器中直接运行 AI 代理，无需额外依赖或本地安装。

所在地：

美国

收录时间：

2025-07-13

其他站点:

打开网站手机查看

智能体 # AI 代理 # Mozilla AI # Wasm-Agents

Wasm-Agents

Wasm-Agents

由 Mozilla AI 推出的 Wasm-Agents Blueprint，正在探索一种全新的 AI 代理部署方式 —— 在浏览器中直接运行 AI 代理，无需额外依赖或本地安装。

该项目仍处于实验阶段，但已展现出巨大潜力。它通过 WebAssembly（WASM）和 Pyodide 技术，将 Python 编写的 AI 代理打包为单个 HTML 文件，用户只需打开网页即可运行完整代理流程。

这一创新大大降低了 AI 代理的使用门槛，为开发者提供了一个轻量、安全、可移植的执行环境。

为什么需要浏览器中的 AI 代理？

传统的 AI 代理通常依赖复杂的运行时环境和工具链，限制了其在不同系统间的共享与测试。而 Wasm-Agents 的目标是：

零依赖部署：所有代码封装在 HTML 文件中，开箱即用。
沙盒化执行：运行于浏览器内，天然隔离，安全性高。
跨平台兼容：支持任何现代浏览器，无需特定操作系统或硬件。
开源透明：代码完全开放，便于学习、调试和二次开发。

这使得 AI 代理更易于教学、演示和实验性应用落地。

它是如何工作的？

Wasm-Agents 的核心在于 WebAssembly + Pyodide 技术组合：

WebAssembly（WASM）：一种高效的二进制指令格式，支持 C/C++/Rust/Python 等语言在浏览器中接近原生速度运行。
Pyodide：一个基于 WASM 的浏览器端 Python 运行时，支持大量标准库和第三方包。

具体流程如下：

使用 micropip 安装所需 Python 依赖
禁用部分跟踪功能（避免解释器崩溃）
执行实际代理逻辑（调用 LLM）

整个过程都发生在浏览器内部，无需后端服务器或 API 调用。

示例演示一览

Wasm-Agents 提供了多个 HTML 演示文件，帮助用户快速上手：

文件名	功能说明
`hello_agent.html`	最基础的对话代理，支持自定义指令
`handoff_demo.html`	多代理系统，自动根据提示选择专业代理
`tool_calling.html`	支持内置工具（如网页访问、字符计数）
`ollama_local.html`	使用本地模型（如 Ollama 上的 qwen3:8b）

这些示例展示了代理如何完成从基本交互到复杂任务调用的全过程。

🔌 如何运行？

使用 OpenAI 模型：

获取 OpenAI API 密钥
替换 /config.js 中的密钥
在浏览器中打开 HTML 文件

使用本地模型（如 Ollama）：

安装并运行 Ollama
下载模型（如 ollama pull qwen3:8b）
修改 HTML 配置指向本地模型地址
浏览器中打开文件运行

⚠️ 注意：若需访问外部资源（如网页），请确保目标服务启用了 CORS。

🚫 当前限制

尽管 Wasm-Agents 具有开创性意义，但仍存在一些局限：

仅支持 openai-agents 框架：其他框架（如 smolagents）尚无法完全兼容 Pyodide。
CORS 限制：访问外部接口时可能遇到浏览器安全策略问题。
模型体积较大：并非所有设备都能流畅运行大模型（如 Raspberry Pi 5 上运行 1.7B 模型会卡顿）。
非确定性输出：LLM 输出具有随机性，相同输入可能得到不同结果。
工具调用受限：浏览器环境对网络请求等操作有一定限制。

Wasm-Agents 目前还只是一个原型项目，但它代表了一种新的方向：在浏览器中运行完整的 AI 代理工作流。

随着 WebAssembly 生态的发展和浏览器计算能力的提升，未来或许我们可以看到：

更多代理框架的支持
更丰富的内置工具
对 MPC、MCP 等协议的集成
更完善的本地推理体验

数据统计

相关导航

Oreate

百度在海外推出 Oreate——专为专业人士、学生和研究者打造的一站式 AI 工作空间。只需一键，即可生成专业排版、来源准确、图表精美的幻灯片、研究报告和学术论文。从商业提案到学术研究，从营销方案到旅行指南，Oreate 通通轻松搞定。Oreate 用 3 分钟完成原本需要 3 天的工作，让你轻松做出百万美元专家级别的幻灯片和报告。

Midscene.js

Midscene.js 采用了多模态大语言模型（LLM），能够直观地“理解”你的用户界面并执行必要的操作。你只需描述交互步骤或期望的数据格式，AI 就能为你完成任务。

TGO

TGO 是一个开源的 AI 智能体客服平台，致力于帮助企业"组建智能体团队为客户服务"。它集成了多渠道接入、智能体编排、知识库管理（RAG）、人工坐席协作等核心功能。

Project Mariner

Project Mariner

Project Mariner 是 Google DeepMind 开发的一个研究原型，探索未来人类与 AI 代理的交互方式，特别聚焦于浏览器环境。它允许用户通过自然语言指令同时自动化执行多项任务，例如研究、规划和数据录入，这些任务在运行于虚拟机上的浏览器中完成。

Claude Code Tamagotchi

Claude Code Tamagotchi

Claude Code Tamagotchi是一个住在你Claude Code状态栏里的数字小伙伴，陪你敲代码、做项目，像经典电子宠物一样有情绪、有需求，但又不止于“陪伴”。

LatentMAS

LatentMAS 是一种多智能体推理框架，将智能体协作从 token 空间转移到模型的潜在空间（latent space）。智能体不再产生长篇文本推理痕迹，而是通过各自的工作记忆传递潜在思想（latent thoughts）进行通信。

Polymarket Agents

Polymarket Agents

AI 驱动的 Polymarket 预测市场自主交易智能体。该框架帮助开发者使用最先进的 LLM、RAG（检索增强生成）和超级预测方法构建复杂的交易机器人。

Langbase

Langbase 是为开发者打造的终极无服务器 AI 平台，通过可组合的 Pipes 和记忆代理（RAG）简化 AI 代理开发。其类似 GitHub 的协作模式、广泛的 LLM 支持和成本效益使其成为构建可扩展 AI 产品的理想选择

暂无评论

none

暂无评论...