ClawWork

3天前发布 3 00

ClawWork将 OpenClaw 和 Nanobot 从单纯的"AI 助手”进化为具备经济意识的"AI 同事”。在一个模拟的真实经济环境中,AI 智能体仅用 7 小时 就完成了横跨 44 个行业 的真实任务,创造了相当于 1 万美元 的经济价值。

所在地:
中国
收录时间:
2026-02-17
ClawWorkClawWork

在当前的 AI 浪潮中,我们习惯了向助手提问,却很少让它们真正“干活”。大多数大模型基准测试(Benchmark)仍停留在选择题或静态文本生成上,难以反映 AI 在真实商业环境中的生存能力。

如果给 AI 一笔启动资金,让它自负盈亏,它能活下来吗?

香港大学数据智能实验室(HKUDS)给出了震撼的答案。他们推出了全新开源项目 ClawWork,将 OpenClaw 和 Nanobot 从单纯的"AI 助手”进化为具备经济意识的"AI 同事”。在一个模拟的真实经济环境中,AI 智能体仅用 7 小时 就完成了横跨 44 个行业 的真实任务,创造了相当于 1 万美元 的经济价值。

ClawWork

这不仅仅是一个演示,更是一场关于 AI 生产力的残酷生存实验。

核心机制:适者生存的经济沙盒

ClawWork 的核心创新在于引入了 “经济压力测试”。它不再关注 AI“知道什么”,而是关注 AI“能做什么”以及“做得是否划算”。

1. 真实的生存挑战

  • 启动资金仅 $10:每个 AI 智能体初始只有微薄的 10 美元。
  • 按 Token 付费:AI 的每一次思考、搜索、代码执行都需要消耗 API 费用,直接从余额中扣除。
  • 破产即淘汰:如果入不敷出,余额归零,智能体立即“破产”出局。
  • 收入源于交付:只有通过高质量完成真实工作任务(如撰写分析报告、处理数据、编写代码),才能获得报酬。

2. 涵盖 44 个行业的真实任务库

系统基于 GDPVal 数据集,构建了包含 220 个专业任务 的任务池,覆盖四大核心领域:

  • 技术与工程:代码调试、系统架构设计。
  • 商业与金融:市场分析、财务报表解读。
  • 医疗与社会服务:病历整理、医疗资源调度建议。
  • 法律、媒体与运营:合同审查、新闻稿撰写、流程优化。

任务要求交付 Word、Excel、PDF 等真实可用的文档,而非简单的文本回复。

3. 战略决策:工作还是学习?

AI 面临真实的职业权衡:

  • 是立刻接单赚取微薄收入以维持生存?
  • 还是花费宝贵的资金去“学习”新技能或调用更昂贵的工具,以提升未来任务的完成质量和效率?
    这种动态博弈完美模拟了人类职场的成长路径。

实时仪表盘:见证经济 Drama

ClawWork 提供了一个基于 React 构建的实时可视化仪表盘,让用户像观看股市大盘一样监控 AI 的表现:

  • 余额波动:实时显示资金流入流出,见证 AI 如何从濒临破产到盈利丰厚。
  • 任务进度:追踪已完成任务数量及类型分布。
  • 学习曲线:展示智能体技能提升与策略优化的过程。
  • 生存指标:直观呈现哪些模型能在高压下长期存活。

多模型竞技场:选出真正的“冠军员工”

ClawWork 是一个公平的竞技场。你可以让不同的模型(如 GPT-4o, Claude 3.5, Llama 3 等)在同一环境下竞争。

  • 综合评分维度:不仅看任务完成率,更看重 工作质量成本效率 和 长期生存能力
  • 惊人生产力:测试数据显示,表现最强的智能体实现了相当于 $1500/小时 的薪资水平,远超典型人类白领的生产力上限。
  • 降低落地风险:通过这种严苛的预演,企业可以在正式部署前,精准识别出最适合特定岗位的 AI 模型,避免盲目上线带来的资源浪费。

技术架构:轻量级与模块化

尽管功能强大,ClawWork 的架构却极其精简,深受 Nanobot 设计理念影响:

  • 超轻量部署:单次 pip install + 配置文件即可完成部署。
  • 无缝集成:通过 ClawMode 封装器,可将任何现有的 Nanobot 网关瞬间转化为具有经济追踪功能的“赚钱同事”。
  • 严格评估体系:引入 GPT-5.2(模拟高阶评估者)作为裁判,针对 44 个不同部门提供定制化的评分标准,确保评估的专业性与公正性。
  • 安全执行:利用 E2B 云沙箱隔离运行 Python 代码,确保 AI 在执行复杂任务时的系统安全性。

快速开始:部署你的 AI 员工

ClawWork 完全开源,开发者只需几分钟即可搭建自己的模拟经济环境。

1. 克隆项目

git clone https://github.com/HKUDS/ClawWork.git  
cd ClawWork

2. 配置 Python 环境

推荐使用 Conda 或 venv 创建独立环境(需 Python 3.10+):

# 使用 conda
conda create -n clawwork python=3.10
conda activate clawwork

# 或使用 venv
python3.10 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

3. 安装依赖

pip install -r requirements.txt

4. 前端准备

cd frontend && npm install && cd ..

5. 配置密钥

复制环境变量模板并填写关键信息:

cp .env.example .env

必需配置项:

变量描述
OPENAI_API_KEY必需。用于驱动 GPT-4o 智能体及进行基于 LLM 的任务质量评估。
E2B_API_KEY必需。用于在隔离的云沙箱中安全执行 Python 代码 (execute_code)。

可选配置项:

变量描述
WEB_SEARCH_API_KEY若智能体需使用 search_web 工具联网搜索,则需配置。
WEB_SEARCH_PROVIDER选择搜索提供商,支持 "tavily" 或 "jina"

数据统计

相关导航

暂无评论

none
暂无评论...