
在当前的 AI 浪潮中,我们习惯了向助手提问,却很少让它们真正“干活”。大多数大模型基准测试(Benchmark)仍停留在选择题或静态文本生成上,难以反映 AI 在真实商业环境中的生存能力。
如果给 AI 一笔启动资金,让它自负盈亏,它能活下来吗?
香港大学数据智能实验室(HKUDS)给出了震撼的答案。他们推出了全新开源项目 ClawWork,将 OpenClaw 和 Nanobot 从单纯的"AI 助手”进化为具备经济意识的"AI 同事”。在一个模拟的真实经济环境中,AI 智能体仅用 7 小时 就完成了横跨 44 个行业 的真实任务,创造了相当于 1 万美元 的经济价值。

这不仅仅是一个演示,更是一场关于 AI 生产力的残酷生存实验。
核心机制:适者生存的经济沙盒
ClawWork 的核心创新在于引入了 “经济压力测试”。它不再关注 AI“知道什么”,而是关注 AI“能做什么”以及“做得是否划算”。
1. 真实的生存挑战
- 启动资金仅 $10:每个 AI 智能体初始只有微薄的 10 美元。
- 按 Token 付费:AI 的每一次思考、搜索、代码执行都需要消耗 API 费用,直接从余额中扣除。
- 破产即淘汰:如果入不敷出,余额归零,智能体立即“破产”出局。
- 收入源于交付:只有通过高质量完成真实工作任务(如撰写分析报告、处理数据、编写代码),才能获得报酬。
2. 涵盖 44 个行业的真实任务库
系统基于 GDPVal 数据集,构建了包含 220 个专业任务 的任务池,覆盖四大核心领域:
- 技术与工程:代码调试、系统架构设计。
- 商业与金融:市场分析、财务报表解读。
- 医疗与社会服务:病历整理、医疗资源调度建议。
- 法律、媒体与运营:合同审查、新闻稿撰写、流程优化。
任务要求交付 Word、Excel、PDF 等真实可用的文档,而非简单的文本回复。
3. 战略决策:工作还是学习?
AI 面临真实的职业权衡:
- 是立刻接单赚取微薄收入以维持生存?
- 还是花费宝贵的资金去“学习”新技能或调用更昂贵的工具,以提升未来任务的完成质量和效率?
这种动态博弈完美模拟了人类职场的成长路径。
实时仪表盘:见证经济 Drama
ClawWork 提供了一个基于 React 构建的实时可视化仪表盘,让用户像观看股市大盘一样监控 AI 的表现:
- 余额波动:实时显示资金流入流出,见证 AI 如何从濒临破产到盈利丰厚。
- 任务进度:追踪已完成任务数量及类型分布。
- 学习曲线:展示智能体技能提升与策略优化的过程。
- 生存指标:直观呈现哪些模型能在高压下长期存活。
多模型竞技场:选出真正的“冠军员工”
ClawWork 是一个公平的竞技场。你可以让不同的模型(如 GPT-4o, Claude 3.5, Llama 3 等)在同一环境下竞争。
- 综合评分维度:不仅看任务完成率,更看重 工作质量、成本效率 和 长期生存能力。
- 惊人生产力:测试数据显示,表现最强的智能体实现了相当于 $1500/小时 的薪资水平,远超典型人类白领的生产力上限。
- 降低落地风险:通过这种严苛的预演,企业可以在正式部署前,精准识别出最适合特定岗位的 AI 模型,避免盲目上线带来的资源浪费。
技术架构:轻量级与模块化
尽管功能强大,ClawWork 的架构却极其精简,深受 Nanobot 设计理念影响:
- 超轻量部署:单次
pip install+ 配置文件即可完成部署。 - 无缝集成:通过 ClawMode 封装器,可将任何现有的 Nanobot 网关瞬间转化为具有经济追踪功能的“赚钱同事”。
- 严格评估体系:引入 GPT-5.2(模拟高阶评估者)作为裁判,针对 44 个不同部门提供定制化的评分标准,确保评估的专业性与公正性。
- 安全执行:利用 E2B 云沙箱隔离运行 Python 代码,确保 AI 在执行复杂任务时的系统安全性。
快速开始:部署你的 AI 员工
ClawWork 完全开源,开发者只需几分钟即可搭建自己的模拟经济环境。
1. 克隆项目
git clone https://github.com/HKUDS/ClawWork.git
cd ClawWork
2. 配置 Python 环境
推荐使用 Conda 或 venv 创建独立环境(需 Python 3.10+):
# 使用 conda
conda create -n clawwork python=3.10
conda activate clawwork
# 或使用 venv
python3.10 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
3. 安装依赖
pip install -r requirements.txt
4. 前端准备
cd frontend && npm install && cd ..
5. 配置密钥
复制环境变量模板并填写关键信息:
cp .env.example .env
必需配置项:
| 变量 | 描述 |
|---|---|
OPENAI_API_KEY | 必需。用于驱动 GPT-4o 智能体及进行基于 LLM 的任务质量评估。 |
E2B_API_KEY | 必需。用于在隔离的云沙箱中安全执行 Python 代码 (execute_code)。 |
可选配置项:
| 变量 | 描述 |
|---|---|
WEB_SEARCH_API_KEY | 若智能体需使用 search_web 工具联网搜索,则需配置。 |
WEB_SEARCH_PROVIDER | 选择搜索提供商,支持 "tavily" 或 "jina"。 |
数据统计
相关导航


Wegent

Maximor

OpenClaw汉化发行版

Action Agent

AWorld

OpenClaw-Docker-CN-IM






