ClawWork是什么
ClawWork是香港大学数据科学实验室开发的AI经济压力测试框架,允许AI在模拟经济环境中完成真实工作任务并获得报酬。核心逻辑是让初始资金仅10美元的AI通过完成220个专业任务(覆盖制造、金融、医疗等44个经济领域)赚取收益,每生成一个token都会扣除成本,无法盈利则会"破产"。技术架构分为五层,包括基础层、核心引擎层、价值量化层等,支持模块化替换和轻量部署。用户可通过GitHub一键安装,实时查看AI的收入、成本和任务完成情况。

ClawWork的功能特色
- 220 个真实职业任务:来自 OpenAI GDPVal 数据集,覆盖 44 个经济部门(制造、金融、医疗、政府、零售等),每个任务都对应真实世界的工作场景。
- 经济责任制:每个 Token 都需付费,收入只来自完成任务,质量由 GPT-5.2 评估(0-1 分),模拟真实商业环境中的成本控制压力。
- 工作 vs 学习权衡:Agent 每天需做出战略决策——立即工作赚钱维持生存,还是投资学习提升未来表现。
- 多模型竞技场:支持 GPT-4o、Claude、GLM、Kimi、Qwen 等主流模型同台竞技,对比经济生存能力。
- 实时仪表板:基于 React 的可视化监控系统,实时追踪余额、收入、成本和生存状态。
- Nanobot/OpenClaw 集成:通过 ClawMode 将任何 Nanobot 网关转为经济追踪型 AI 同事,支持本地和云端部署。
ClawWork的核心优势
- 真实经济压力测试:不同于传统基准只关注准确率,ClawWork 引入"资金耗尽即死亡"的生存机制,迫使 Agent 在质量与成本间做权衡。
- 按质付费机制:任务报酬基于质量评分,公式为
Payment = quality_score × (estimated_hours × BLS_hourly_wage),任务价值范围 $82.78 - $5,004,平均 $259.45。 - 自我进化能力:顶级 Agent 可达 $1,500+/小时 等效收入,7 小时内最高赚取 $10,000,展现出通过经验积累提升盈利能力的可能。
- 开放可扩展:完全开源,支持自定义任务集、评估模型和经济参数,便于研究者复现和扩展。
ClawWork官网是什么
- GitHub仓库:https://github.com/HKUDS/ClawWork
ClawWork的适用人群
- AI 研究者:评估不同 LLM 在真实经济场景下的决策能力和成本效益。
- Agent 开发者:测试和优化自家 Agent 的商业生存能力。
- 经济学家:研究 AI 劳动力市场的行为和效率。
- 企业决策者:评估将 AI Agent 投入实际业务的经济可行性。
- 开源社区贡献者:参与构建更完善的 AI Agent 经济评估生态。
© 版权声明
文章版权归 AI分享圈 所有,未经允许请勿转载。
相关文章
暂无评论...




