ClawWork - 香港大学数据科学实验室开源的AI经济压力测试框架

最新AI资源1个月前发布 AI分享圈

27.6K 00

ClawWork是什么

ClawWork是香港大学数据科学实验室开发的AI经济压力测试框架，允许AI在模拟经济环境中完成真实工作任务并获得报酬。核心逻辑是让初始资金仅10美元的AI通过完成220个专业任务（覆盖制造、金融、医疗等44个经济领域）赚取收益，每生成一个token都会扣除成本，无法盈利则会"破产"。技术架构分为五层，包括基础层、核心引擎层、价值量化层等，支持模块化替换和轻量部署。用户可通过GitHub一键安装，实时查看AI的收入、成本和任务完成情况。

ClawWork - 香港大学数据科学实验室开源的AI经济压力测试框架

ClawWork的功能特色

220 个真实职业任务：来自 OpenAI GDPVal 数据集，覆盖 44 个经济部门（制造、金融、医疗、政府、零售等），每个任务都对应真实世界的工作场景。
经济责任制：每个 Token 都需付费，收入只来自完成任务，质量由 GPT-5.2 评估（0-1 分），模拟真实商业环境中的成本控制压力。
工作 vs 学习权衡：Agent 每天需做出战略决策——立即工作赚钱维持生存，还是投资学习提升未来表现。
多模型竞技场：支持 GPT-4o、Claude、GLM、Kimi、Qwen 等主流模型同台竞技，对比经济生存能力。
实时仪表板：基于 React 的可视化监控系统，实时追踪余额、收入、成本和生存状态。
Nanobot/OpenClaw 集成：通过 ClawMode 将任何 Nanobot 网关转为经济追踪型 AI 同事，支持本地和云端部署。

ClawWork的核心优势

真实经济压力测试：不同于传统基准只关注准确率，ClawWork 引入"资金耗尽即死亡"的生存机制，迫使 Agent 在质量与成本间做权衡。
按质付费机制：任务报酬基于质量评分，公式为 Payment = quality_score × (estimated_hours × BLS_hourly_wage)，任务价值范围 $82.78 - $5,004，平均 $259.45。
自我进化能力：顶级 Agent 可达 $1,500+/小时 等效收入，7 小时内最高赚取 $10,000，展现出通过经验积累提升盈利能力的可能。
开放可扩展：完全开源，支持自定义任务集、评估模型和经济参数，便于研究者复现和扩展。

ClawWork官网是什么

GitHub仓库：https://github.com/HKUDS/ClawWork

ClawWork的适用人群

AI 研究者：评估不同 LLM 在真实经济场景下的决策能力和成本效益。
Agent 开发者：测试和优化自家 Agent 的商业生存能力。
经济学家：研究 AI 劳动力市场的行为和效率。
企业决策者：评估将 AI Agent 投入实际业务的经济可行性。
开源社区贡献者：参与构建更完善的 AI Agent 经济评估生态。

© 版权声明

文章版权归 AI分享圈所有，未经允许请勿转载。

相关文章

Intellectia：使用AI驱动的智能投资分析平台，优化投资决策

Intellectia：使用AI驱动的智能投资分析平台，优化投资决策

最新AI资源 # AI金融数据分析

1年前

060.4K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

最新AI资源 # AI开源项目 # OCR # 免费大模型API

1年前

062.4K

Getfloorplan：生成2D和3D室内平面图及虚拟导览（付费）

Getfloorplan：生成2D和3D室内平面图及虚拟导览（付费）

最新AI资源 # AI文本与图片转3D

1年前

061.8K

Noisee AI：用音乐旋律生成风格一致的MV动态视频

Noisee AI：用音乐旋律生成风格一致的MV动态视频

最新AI资源 # AI视频生成工具

1年前

080.5K

暂无评论

您必须登录才能参与评论！

none

暂无评论...