ClawWork - 香港大学数据科学实验室开源的AI经济压力测试框架

最新AI资源13小时前发布 AI分享圈
1.3K 00
堆友AI

ClawWork是什么

ClawWork是香港大学数据科学实验室开发的AI经济压力测试框架,允许AI在模拟经济环境中完成真实工作任务并获得报酬。核心逻辑是让初始资金仅10美元的AI通过完成220个专业任务(覆盖制造、金融、医疗等44个经济领域)赚取收益,每生成一个token都会扣除成本,无法盈利则会"破产"。技术架构分为五层,包括基础层、核心引擎层、价值量化层等,支持模块化替换和轻量部署。用户可通过GitHub一键安装,实时查看AI的收入、成本和任务完成情况。

ClawWork - 香港大学数据科学实验室开源的AI经济压力测试框架

ClawWork的功能特色

  • 220 个真实职业任务:来自 OpenAI GDPVal 数据集,覆盖 44 个经济部门(制造、金融、医疗、政府、零售等),每个任务都对应真实世界的工作场景。
  • 经济责任制:每个 Token 都需付费,收入只来自完成任务,质量由 GPT-5.2 评估(0-1 分),模拟真实商业环境中的成本控制压力。
  • 工作 vs 学习权衡:Agent 每天需做出战略决策——立即工作赚钱维持生存,还是投资学习提升未来表现。
  • 多模型竞技场:支持 GPT-4o、Claude、GLM、Kimi、Qwen 等主流模型同台竞技,对比经济生存能力。
  • 实时仪表板:基于 React 的可视化监控系统,实时追踪余额、收入、成本和生存状态。
  • Nanobot/OpenClaw 集成:通过 ClawMode 将任何 Nanobot 网关转为经济追踪型 AI 同事,支持本地和云端部署。

ClawWork的核心优势

  • 真实经济压力测试:不同于传统基准只关注准确率,ClawWork 引入"资金耗尽即死亡"的生存机制,迫使 Agent 在质量与成本间做权衡。
  • 按质付费机制:任务报酬基于质量评分,公式为 Payment = quality_score × (estimated_hours × BLS_hourly_wage),任务价值范围 $82.78 - $5,004,平均 $259.45。
  • 自我进化能力:顶级 Agent 可达 $1,500+/小时 等效收入,7 小时内最高赚取 $10,000,展现出通过经验积累提升盈利能力的可能。
  • 开放可扩展:完全开源,支持自定义任务集、评估模型和经济参数,便于研究者复现和扩展。

ClawWork官网是什么

  • GitHub仓库:https://github.com/HKUDS/ClawWork

ClawWork的适用人群

  • AI 研究者:评估不同 LLM 在真实经济场景下的决策能力和成本效益。
  • Agent 开发者:测试和优化自家 Agent 的商业生存能力。
  • 经济学家:研究 AI 劳动力市场的行为和效率。
  • 企业决策者:评估将 AI Agent 投入实际业务的经济可行性。
  • 开源社区贡献者:参与构建更完善的 AI Agent 经济评估生态。
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...