Agenta：集成到AI应用的提示词与模型效果评估工具

最新AI资源1年前发布 AI分享圈

59K 00

综合介绍

Agenta 是一个开源的AI模型管理工具，专门帮助用户轻松实验提示词、测试模型效果和监控运行情况。它适合想快速开发AI应用的人，提供了一个简单操作的平台。你可以用它试试不同提示词的效果，对比多个AI模型的回答，还能实时查看应用的运行数据，比如速度和费用。Agenta 支持很多常见的AI框架，比如 LangChain，功能强大又灵活。因为是开源的，任何人都可以免费使用，还能在 GitHub 上找到代码自己改动。现在它在 GitHub 上已经有 2.1k 多人点赞，说明很受欢迎。

Agenta：集成到AI应用的提示词与模型效果评估工具

功能列表

提示词实验区：在网页上输入提示词，试试不同AI模型的效果，还能对比结果。
自定义任务流程：可以自己搭一个AI任务流程，比如让模型根据资料回答问题。
模型效果测试：用工具检查模型答得怎么样，支持自动评分或请人帮忙看。
人工检查支持：能和团队一起对比模型回答，挑出最好的。
提示词保存：把试好的提示词存下来，随时调出来用。
实时运行监控：看看AI用起来花多少钱、跑多快，有没有问题。

使用帮助

安装流程

Agenta 可以装在自己电脑上用，也可以用云端服务。下面是装到电脑上的步骤：

准备环境
- 确保电脑有 Docker 和 Docker Compose，这两个是跑 Agenta 的必备工具。
- 最好用 Linux 或 macOS 系统，Windows 用户得先开 WSL2。
- 检查一下 Python（建议 3.10 或更高）和 Git 装好了没，后面会用到。

下载并启动

打开终端，输入命令把 Agenta 下载下来：

mkdir agenta && cd agenta
curl -L https://raw.githubusercontent.com/agenta-ai/agenta/main/docker-compose.gh.yml -o docker-compose.gh.yml

然后启动服务：

docker compose -f docker-compose.gh.yml up -d

等几分钟，打开浏览器，输入 http://localhost:3000，就能看到页面。

设置选项（可选）
- 如果不想让 Agenta 收集匿名数据，可以改 agenta-web/.env 文件，把 TELEMETRY_TRACKING_ENABLED 设成 false。
- 用命令行（CLI）的用户，可以改 ~/.agenta/config.toml，设成 telemetry_tracking_enabled = false。
检查有没有装好
- 在浏览器里看到 Agenta 的欢迎页面就说明成功了。
- 如果想用云端，可以看官网怎么连 AWS 或其他云服务。

主要功能怎么用

1. 提示词实验区

怎么进：登录 Agenta，点左边菜单的“Playground”。
试提示词：在框里输入想试的话，比如“写一篇短文”。
挑模型：从列表里选AI模型（比如 GPT-4），可以多选几个对比。
跑结果：点“Run”，就能看到不同模型的回答。
改和存：觉得哪个回答不好就改改提示词，满意了点“Save”存起来。
用在哪：适合试试哪个模型回答问题更好，或者调提示词让回答更准。

2. 搭自己的任务流程

新建流程：点“Workflows”，选“New Workflow”，挑个类型（比如问答流程）。
填东西：输入需要的资料，比如知识库地址或任务要求。
试一下：点“Test”，看看结果对不对。
团队合作：请同事一起改参数，看看效果。
存和用：调好了就保存，能直接拿去用。
用在哪：适合做复杂任务，比如让AI读资料回答问题。

3. 测试模型效果

开始测试：点“Evaluation”，选“New Evaluation”。
选测试法：挑现成的评分工具，或者自己写个测试代码。
跑数据：放点测试问题进去，点“Run”，会出成绩单。
请人看：想人工查的话，点“Human Eval”，请人挑挑答案。
看结果：测试完有图表，告诉你模型好不好。
用在哪：适合检查模型能不能用，或者找找问题。

4. 监控运行情况

去哪看：点“Monitoring”看AI用得怎么样。
看数据：能看到花了多少钱、跑多快，有没有出错。
查记录：选个应用，看看每次请求的细节。
修问题：要是出错了，点“Trace”查原因。
怎么改：根据数据调提示词或参数，让它跑得更好。
用在哪：适合上线后盯着点，确保没问题。

小贴士

网络：装的时候网得稳，不然 Docker 下载会卡。
权限：多人用时设好权限，别让人乱改。
求助：有问题看 GitHub 文档，或者去 Slack 问问。

用上面这些步骤，你就能很快上手 Agenta，调提示词、管模型、看数据都方便得很。不管是自己玩还是团队用，都能省不少力气。

最新AI资源 # AI开源项目 # PROMPTS辅助工具

© 版权声明

文章版权归 AI分享圈所有，未经允许请勿转载。

相关文章

Aiarty Image Matting：专业AI图像抠图，精准去除背景，免授权安装包

Aiarty Image Matting：专业AI图像抠图，精准去除背景，免授权安装包

最新AI资源 # AI抠图改背景

1年前

048.3K

VocalRemover：免费分离歌曲人声与伴奏的在线工具

VocalRemover：免费分离歌曲人声与伴奏的在线工具

最新AI资源 # AI音视频编辑

12个月前

0106.6K

Nexa：本地运行的小型多模态AI解决方案

Nexa：本地运行的小型多模态AI解决方案

最新AI资源 # 本地部署开源大模型工具

1年前

063.8K

Androidify - 谷歌开源如何在Android上构建AI应用的免费资源

Androidify - 谷歌开源如何在Android上构建AI应用的免费资源

6个月前

031K

暂无评论

您必须登录才能参与评论！

none

暂无评论...