综合介绍
AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基础。该框架支持多种大语言模型(LLM),如Grok、Gemini等,并具备高性能的多智能体协作系统,在GAIA基准测试中表现优异,媲美OpenAI的Deep Research。AutoAgent不仅操作简单,还提供文件上传、命令行交互等功能,适合开发者、非技术用户甚至研究人员使用。目前,它正在开发Web界面和更多工具集成,未来潜力巨大。
功能列表
- 自然语言创建智能体:通过文字描述需求,自动生成专属AI智能体,无需代码。
- 多智能体协作系统:内置开箱即用的多智能体模式,支持复杂任务分解与协作。
- 支持多种LLM模型:兼容OpenAI、Deepseek、Grok等多种大语言模型,灵活切换。
- 文件上传与数据交互:支持上传文件(如图像、PDF等),增强数据处理能力。
- 命令行交互界面:提供CLI模式,方便用户直接输入请求并获取结果。
- 高性能任务处理:在GAIA基准中表现卓越,效率媲美付费AI工具。
- 工作流编辑器:通过自然语言设计智能体协作流程,简化复杂任务管理。
使用帮助
安装流程
AutoAgent的使用需要一定的环境配置,以下是详细的安装步骤,适合Windows、MacOS或Linux系统用户。
1. 准备环境
- 安装Python:确保系统安装了Python 3.10或以上版本,可在Python官网下载安装。
- 安装Git:用于克隆AutoAgent代码库,访问Git官网下载并安装。
- 安装Docker:AutoAgent使用Docker容器化运行环境,前往Docker官网安装Docker Desktop(Windows/Mac)或Docker Engine(Linux)。
2. 克隆代码库
打开终端(Windows用户可用CMD或PowerShell,Mac/Linux用户用默认终端),输入以下命令克隆AutoAgent仓库:
git clone https://github.com/HKUDS/AutoAgent.git
cd AutoAgent
3. 安装依赖
在AutoAgent目录下,运行以下命令安装必要的Python依赖:
pip install -e .
这将安装AutoAgent所需的所有库,确保网络畅通以完成下载。
4. 配置环境变量
- 创建一个
.env
文件,复制仓库中的.env.template
并重命名为.env
。 - 编辑
.env
文件,填入必要的API密钥。例如:GITHUB_AI_TOKEN=your_github_token OPENAI_API_KEY=your_openai_key XAI_API_KEY=your_xai_key
GITHUB_AI_TOKEN
是必需的,可在GitHub个人设置中生成。- 其他API密钥根据你想使用的模型选择性填写(如OpenAI、Deepseek等)。
5. 启动Docker镜像
运行以下命令拉取预构建的Docker镜像:
docker pull tjbtech1/AutoAgent:latest
镜像会根据你的系统架构自动适配(AMD64或ARM)。
6. 启动AutoAgent
在终端中运行以下命令启动CLI模式:
auto main
启动后,你将进入AutoAgent的命令行界面,可以开始使用。
主要功能操作流程
功能1:通过自然语言创建智能体
- 操作步骤:
- 启动CLI后,输入
agent editor
进入智能体编辑模式。 - 输入需求描述,例如:“创建一个能分析PDF文档并总结内容的智能体。”
- 系统会自动生成智能体配置文件并询问是否需要调整工具(如文件读取工具)。
- 输入
create
确认创建,智能体即可使用。
- 启动CLI后,输入
- 示例:输入“帮我分析销售数据的PDF并生成报告”,AutoAgent会自动配置一个支持PDF解析和报告生成的智能体。
功能2:多智能体协作任务
- 操作步骤:
- 启动后输入
user mode
,进入多智能体模式。 - 输入任务,如:“研究某产品的市场趋势并给出建议。”
- 系统会分解任务,自动分配给多个智能体(搜索、分析、总结等),并输出结果。
- 启动后输入
- 示例:输入“分析2025年AI趋势”,AutoAgent会通过搜索智能体收集数据,分析智能体整理信息,最后生成完整报告。
功能3:文件上传与处理
- 操作步骤:
- 在CLI中输入
upload 文件路径
,如upload ./sales.pdf
。 - 输入任务,如:“总结这个PDF的内容。”
- 智能体会读取文件并返回总结结果。
- 在CLI中输入
- 注意:支持多种格式(PDF、图像、文本等),文件名不要包含空格。
功能4:设计工作流
- 操作步骤:
- 输入
workflow editor
进入工作流编辑模式。 - 输入流程描述,如:“先搜索资料,再分析数据,最后生成图表。”
- 系统会生成工作流配置,输入
run
执行任务。
- 输入
- 示例:输入“搜索AI论文,提取关键点,生成可视化图表”,AutoAgent会按步骤完成并输出结果。
特色功能操作详解
高性能任务处理
AutoAgent在GAIA基准中表现出色,适合复杂研究任务。
- 如何使用:在
user mode
下输入研究问题,如“量子计算的最新进展是什么?”系统会调用多智能体系统,高效完成搜索与分析。 - 优势:相比传统工具,AutoAgent自研数据库效率更高,响应速度快。
命令行交互
- 如何使用:CLI模式下直接输入任务,如
auto deep-research “分析区块链技术”
,即可获取详细结果。 - 提示:用
@agent_name
指定某智能体,如@search 查找最新AI新闻
。
使用小贴士
- 调试模式:在
.env
中设置DEBUG=True
,可查看详细日志,便于排查问题。 - 模型选择:通过修改
.env
中的COMPLETION_MODEL
切换LLM,如grok-2
或claude-3.5-sonnet
。 - 社区支持:加入AutoAgent的Slack或Discord社区,获取帮助或分享创意。