Los 5 mejores marcos de agentes de IA que merecen la pena en 2025

Base de conocimientos de IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

Agente La traducción más común que he visto hasta ahora es "cuerpo inteligente", pero la traducción directa es "agente".

¿Qué significa Agentic? Creo que algo como "agentic" sería más apropiado.

Para no confundir al lector, en este artículo utilizaré directamente el inglés.

A medida que los LLM evolucionan, las capacidades de las IA ya no se limitan a la automatización de tareas sencillas, sino que pueden gestionar flujos de trabajo complejos y continuos. Por ejemplo, podemos utilizar LLM para crear asistentes inteligentes que encarguen automáticamente artículos en plataformas de comercio electrónico y se encarguen de la entrega en lugar del usuario. EstosLos asistentes basados en LLM se conocen como agentes de IA.

Para ser más específicos, un Agente AI es un asistente inteligente impulsado por LLM que puede ayudar con tareas y herramientas específicas basadas en tareas y herramientas predefinidas. En su forma más básica, un Agente AI tiene las siguientes características clave:

gestión de la memoriaEl Agente de IA puede almacenar y gestionar registros de interacciones con usuarios.
Interacción con fuentes de datos externasCapacidad de comunicarse con sistemas externos para obtener datos o completar tareas.
ejecución de funcionesEl trabajo real se realiza llamando a funciones.

A modo de ejemplo, el Agente AI puede realizar las siguientes tareas:

Reservas en restaurantesPor ejemplo, un agente de IA en un sistema de restauración puede ayudar a los usuarios a reservar asientos en línea, comparar distintos restaurantes y ayudarles a llamar directamente a los restaurantes mediante la interacción por voz.
Colaboración virtual ColegasEl Agente AI puede actuar como "pequeño secretario" de su proyecto, colaborando con los usuarios en tareas específicas.
Automatización de las operaciones diariasLos agentes de IA son capaces de realizar operaciones de varios pasos e incluso operaciones informáticas cotidianas. Por ejemplo, Replit Agent puede simular las operaciones que realizan los desarrolladores en un entorno de desarrollo, instalando automáticamente dependencias y editando código; Anthropic's Ordenador Agente de uso puede guiar Claude Manejar el ordenador de la forma más habitual para los usuarios, como mover el ratón, pulsar botones e introducir texto.

Mientras que podemos construir Agentes de IA desde cero utilizando pilas de tecnología como Python, React, etc., es posible construir Agentes de IA desde cero con la ayuda de tecnologías como Phidata, OpenAI Swarm, LangGraph, Microsoft Autogen, CrewAI, Vertex AI, y Langflow El proceso de desarrollo se vuelve más eficiente con frameworks multiagente como AI Assistant. Estos marcos proporcionan herramientas y funciones preempaquetadas que nos ayudan a crear asistentes de IA rápidamente.

¿Cuáles son las ventajas de utilizar estos marcos?

Elegir el LLM adecuadoPuede utilizar LLMs como OpenAI, Anthropic, xAI, Mistral, etc., dependiendo del escenario de aplicación específico, o LLMs como Ollama y herramientas como LM Studio para crear agentes de IA.
Añadir base de conocimientosEstos marcos permiten añadir documentos específicos (p. ej., archivos json, pdf o sitios web) como bases de conocimiento que ayudan al Agente de IA a adquirir y comprender información.
Función de memoria integradaNo es necesario crear sistemas complejos para almacenar y gestionar registros de chat o conversaciones personalizadas. El marco viene con una función de memoria que ayuda al agente de IA a recordar y acceder a interacciones anteriores a lo largo del tiempo.
Herramientas de personalizaciónEl marco Multi-Agent nos permite añadir herramientas personalizadas al agente de IA e integrarlo sin problemas con sistemas externos para realizar operaciones como pagos en línea, búsquedas web, llamadas a API, búsquedas en bases de datos, visualización de vídeos, envío de correos electrónicos, etc.
Simplificar los retos de ingenieríaEstos marcos nos ayudan a simplificar complejas tareas de ingeniería, como la gestión del conocimiento y la memoria, reduciendo así la dificultad técnica a la hora de desarrollar productos de IA.
Desarrollo e implantación aceleradosEl marco proporciona las herramientas y la infraestructura necesarias para crear sistemas de IA, lo que nos ayuda a desarrollar e implantar más rápidamente sistemas de IA en plataformas en la nube como AWS.

Con estos marcos, podemos desarrollar más fácilmente agentes de IA eficientes e inteligentes para mejorar la velocidad y la calidad del desarrollo de productos.

A continuación, nos sumergiremos en las cinco principales plataformas para crear agentes de IA que te ayudarán a ponerte en marcha y a crear tu propio asistente de IA.

La estructura básica de un Agente

El siguiente fragmento de código muestra uno de los Agentes de IA más sencillos. El Agente de IA resuelve problemas utilizando un modelo de lenguaje.La definición de un Agente de IA puede incluir la elección de modelos de lenguaje grandes o pequeños, memoria, almacenamiento, fuentes de conocimiento externas, bases de datos vectoriales, instrucciones, descripciones, nombres, etc.

Por ejemplo, algo como Windsurf Un Agente de IA moderno como este puede ayudar a cualquiera a generar, ejecutar, editar, construir y desplegar rápidamente aplicaciones web full-stack. Admite la generación de código y la creación de aplicaciones para una amplia gama de tecnologías web y bases de datos, como Astro, Vite, Next.js, Superbase, etc.

Casos de aplicación del multiagente en las empresas

Los sistemas de IA agenética tienen una amplia gama de aplicaciones en entornos corporativos.Especialmente en la realización de tareas automatizadas y repetitivas. Estos son los principales escenarios de aplicación en los que el Agente AI resulta útil en el ámbito empresarial:

Llamadas y otros análisisLos sistemas multiagente destacan en el análisis y la elaboración de informes sobre la intención, los datos demográficos y las interacciones de los usuarios. Su capacidad de análisis e información ayuda a las organizaciones a dirigirse a clientes o mercados.
Clasificación de las llamadasClasifica automáticamente las llamadas en función del ancho de banda y la potencia de la red de los participantes para un procesamiento eficaz.
Escucha del mercado: Supervisar y analizar el sentimiento de los clientes en las aplicaciones de mercado.
Análisis de encuestas y comentarios: Utiliza los comentarios de los clientes y los datos de las encuestas para obtener información y mejorar la experiencia del cliente.
Gestión de viajes y gastosAutomatice la notificación, el seguimiento y la aprobación de los gastos.
Banca de Diálogo: Ayuda a los clientes en sus operaciones bancarias a través de chat o asistentes de voz basados en IA.
La IA universal es compatible con los chatbots: Los Agentes de Atención al Cliente pueden gestionar reclamaciones de clientes, solucionar problemas y delegar tareas complejas en otros Agentes.
financieroEl Agente Financiero permite prever las tendencias económicas, bursátiles y de mercado, así como proporcionar consejos prácticos de inversión.
mercadoLos equipos de marketing de las empresas pueden utilizar agentes de IA para crear contenidos y textos publicitarios personalizados para diferentes públicos objetivo con el fin de aumentar las tasas de conversión.
ventas (representante, acuerdo, etc.)AI Agent puede ayudar a analizar los patrones de interacción de los clientes en el sistema y ayudar a los equipos de ventas a centrarse en la conversión de clientes potenciales.
habilidadAgente de codificación AI: en el sector tecnológico, AI Coding Agent ayuda a los desarrolladores e ingenieros a ser más productivos acelerando la finalización, generación, automatización, comprobación y corrección de errores del código.

2024 Marco de los cinco agentes

Puede utilizar varios frameworks de Python para crear y añadir Agentes a aplicaciones y servicios. Estos frameworks incluyen herramientas no-code (visual AI Agent builders), low-code y medium-code. Ahora voy a presentarte cinco de los mejores constructores de agentes basados en Python de 2024, y eres libre de elegir según las necesidades de tu negocio.

1 Fidata

Phidata es un marco basado en Python para convertir LLMs en Agentes en productos de IA, compatible con LLMs de código cerrado y de código abierto de los principales actores como OpenAI, Anthropic, Cohere, Ollama y Juntos AI y mucho más. Con su soporte para bases de datos y almacenes vectoriales, podemos conectar fácilmente sistemas de IA a Postgres, PgVector, Pinecone, LanceDb, etc. Con Phidata, podemos construir Agentes básicos, así como crear Agentes avanzados con llamadas a funciones, salida estructurada y ajuste fino.

Principales características de Phidata

Interfaz de usuario de agente integradaPhidata proporciona una interfaz de usuario lista para usar para ejecutar proyectos de Agente localmente o en la nube y gestionar sesiones en segundo plano.
desplieguesPuede publicar el Agente en GitHub o en cualquier servicio en la nube, o puede conectar una cuenta de AWS para desplegarlo en un entorno de producción.
Seguimiento de los indicadores clave: Proporciona instantáneas de la sesión, llamadas a la API, uso de tokens, y soporta el ajuste de la configuración y las mejoras del Agente.
Soporte de plantillasAcelere el proceso de desarrollo y producción de agentes de IA con plantillas de código base preconfiguradas.
Soporte AWSPhidata se integra perfectamente con AWS y puede ejecutar aplicaciones completas en cuentas de AWS.
Modelo de independencia: Soporte para el uso de la última tecnología de OpenAI, Anthropic, Groq y Mistral y otros modelos avanzados y claves API.
Creación de multiagentesCon Phidata, puede crear un equipo de Agentes que se pasen tareas unos a otros y colaboren en tareas complejas; Phidata gestiona perfectamente la coordinación de los Agentes en segundo plano.

Ahora voy a mostrarte cómo usar el framework Phidata y el LLM de OpenAI para construir un Agente de IA básico en Python que consulte los datos financieros de Yahoo Finanzas, el cual está diseñado para agregar recomendaciones de analistas de varias compañías a través de Yahoo Finanzas.

Instalar dependencias:

Crea un nuevo agente_financiero.py:

import openai
from phi.agent import Agent
from phi.model.openai import OpenAIChat
from phi.tools.yfinance import YFinanceTools
from dotenv import load_dotenv
import os


# 从 .env 文件加载环境变量
load_dotenv()


# 从环境中获取 API 密钥
openai.api_key = os.getenv("OPENAI_API_KEY")


# 初始化 Agent 
finance_agent = Agent(
name="Finance AI Agent",
model=OpenAIChat(id="gpt-4o"),
tools=[
YFinanceTools(
stock_price=True,
analyst_recommendations=True,
company_info=True,
company_news=True,
)
],
instructions=["Use tables to display data"],
show_tool_calls=True,
markdown=True,
)


# 输出分析师对 NVDA 的推荐摘要
finance_agent.print_response("Summarize analyst recommendations for NVDA", stream=True)

Código de arriba:

Importación de módulos y carga de claves API
En primer lugar, importa los módulos y paquetes necesarios y carga la clave API de OpenAI a través del archivo .env. Esta carga de claves API también se aplica a otros proveedores de modelos como Anthropic, Mistral y Groq.
Creación de un proxy
Utilice la clase Agente de Phidata para crear un nuevo Agente y especificar sus funciones y características únicas, incluyendo modelos, herramientas, comandos y mucho más.
Imprimir respuesta
Llame al método print_response para imprimir la respuesta del agente a la pregunta y especifique si desea mostrarla como un flujo (stream=True).

2 Enjambre

Enjambre OpenAI ha publicado recientemente un marco experimental de agentes de código abierto, un marco ligero de orquestación multiagente.

tenga en cuenta: Swarm está aún en fase experimental. Puede utilizarse con fines educativos y de desarrollo, pero no se recomienda para entornos de producción. Para obtener la información más reciente, puede consultar el repositorio oficial:

https://github.com/openai/swarm

Uso del enjambre Agentes responder cantando Transferencias Como abstracción para la orquestación y coordinación de Agentes. es un marco ligero que resulta fácil de probar y gestionar. Los Agentes de Swarm pueden configurarse con herramientas, comandos y otros parámetros para realizar tareas específicas.

Además de su arquitectura ligera y sencilla, Swarm tiene las siguientes características clave:

traspaso a la siguiente generación: Swarm soporta la construcción de sistemas Multi-Agente, donde un Agente puede pasar conversaciones a otros Agentes en cualquier momento.
escalabilidadSwarm: Con su arquitectura de traspaso simplificada, Swarm facilita la creación de sistemas de agentes que pueden dar soporte a millones de usuarios.
escalabilidad: Swarm está diseñado para ser altamente personalizable y puede utilizarse para crear una experiencia de Agente totalmente personalizada.
Sistema integrado de recuperación y gestión de la memoriaEl enjambre dispone de funciones integradas para almacenar y procesar el contenido de los diálogos.
PrivacidadSwarm: Swarm se ejecuta principalmente en el lado del cliente y no conserva el estado entre llamadas, lo que mejora enormemente la privacidad de los datos.
recursos educativosSwarm ofrece una serie de ejemplos de aplicaciones multiagente básicas y avanzadas para que los desarrolladores las prueben y aprendan de ellas.

A continuación, te mostraré cómo usar Swarm:

from swarm import Swarm, Agent

# 初始化 Swarm 客户端
client = Swarm()
mini_model = "gpt-4o-mini"

# 定义协调函数，用于将任务交接给 Agent B
def transfer_to_agent_b():
return agent_b

# 定义 Agent A
agent_a = Agent(
name="Agent A",
instructions="You are a helpful assistant.",
functions=[transfer_to_agent_b],
)

# 定义 Agent B
agent_b = Agent(
name="Agent B",
model=mini_model,
instructions="You speak only in Finnish.",
)

# 运行 Agent 系统并获取响应
response = client.run(
agent=agent_a,
messages=[{"role": "user", "content": "I want to talk to Agent B."}],
debug=False,
)

# 打印 Agent B 的响应
print(response.messages[-1]["content"])

código anterior

1. inicialización
  - Swarm se utiliza para crear una instancia cliente.
  - Agente define el nombre, la función y el modelo de lenguaje del Agente (por ejemplo, gpt-4o-mini).
2. lógica de transición

transfer_to_agent_b es una función coordinadora que transfiere tareas del agente_a al agente_b.

1. Ejecutar el sistema de agentes

client.run() ejecuta el sistema agente, pasando los mensajes y parámetros de depuración para seguir la ejecución de la tarea.

Si cambia el idioma en el comando para agent_b a otro idioma (por ejemplo, inglés, sueco, finlandés), obtendrá una respuesta en el idioma correspondiente.

3 CrewAI

CrewAI Uno de los frameworks de IA basados en Agentes más populares para construir rápidamente Agentes de IA e integrarlos en los últimos LLMs y bases de código. Grandes empresas como Oracle, Deloitte, Accenture y otras utilizan y confían en CrewAI.

CrewAI es más rico y versátil que otros marcos basados en agentes.

escalabilidadAdmite la integración con más de 700 aplicaciones, incluidas Notion, Zoom, Stripe, Mailchimp y Airtable, entre otras.
artefacto
- Los desarrolladores pueden utilizar el marco CrewAI para crear sistemas de automatización multiagente desde cero.
- Los diseñadores pueden crear Agentes totalmente funcionales en un entorno sin código con sus herramientas UI Studio y de plantillas.
desplieguesPuede utilizar su método de despliegue preferido para migrar rápidamente su Agente de desarrollo al entorno de producción.
Supervisión de agentesAl igual que Phidata, CrewAI proporciona paneles intuitivos para supervisar el progreso y el rendimiento de los agentes.
Herramientas de formación integradasUtilice las herramientas integradas de formación y pruebas de CrewAI para mejorar el rendimiento y la eficacia del Agente y garantizar la calidad de sus respuestas.

Primero tenemos que instalar CrewAI:

El comando anterior instala CrewAI y sus herramientas y verifica que la instalación se ha realizado correctamente.

Una vez completada la instalación, puedes ejecutar el siguiente comando para crear un nuevo proyecto CrewAI:

Tras ejecutar este comando, se nos pedirá que seleccionemos uno de la siguiente lista de proveedores de modelos, por ejemplo OpenAI, Anthropic, xAI, Mistral, etc. Después de seleccionar un proveedor, también puede seleccionar un modelo específico de la lista, por ejemplo, gpt-4o-mini.

Los siguientes comandos pueden utilizarse para crear un sistema Multi-Agente:

La aplicación CrewAI completa se ha subido a un repositorio de GitHub y se puede descargar y ejecutar con el siguiente comando:

https://github.com/GetStream/stream-tutorial-projects/tree/main/AI/Multi-Agent-AI

Tras ejecutarlo, verá un resultado de respuesta similar al siguiente:

4 Autogen

Autogen es un framework de código abierto para construir sistemas de Agentes. Con este marco se pueden crear flujos de trabajo LLM y de colaboración multiagente.

Autogen viene con las siguientes características clave:

soporte multilingüeConstruir Agentes utilizando lenguajes de programación como Python y .
Agente localLos agentes pueden ejecutarse y experimentarse localmente para garantizar una mayor privacidad.
comunicación asíncrona de mensajesUtilizar mensajes asíncronos para la comunicación entre Agentes.
escalabilidadAyuda a los desarrolladores a crear redes de agentes distribuidos para la colaboración entre organizaciones.
PersonalizaciónPersonalice y cree una experiencia de sistema de Agente completamente personalizada con sus componentes conectables.

El siguiente bloque de código construye un sencillo sistema de Agente Meteorológico AI:

import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_agentchat.task import Console, TextMentionTermination
from autogen_agentchat.teams import RoundRobinGroupChat
from autogen_ext.models import OpenAIChatCompletionClient

import os
from dotenv import load_dotenv

load_dotenv()

# 定义工具
async def get_weather(city: str) -> str:
return f"The weather in {city} is 73 degrees and Sunny."

async def main() -> None:
# 定义 Agent
weather_agent = AssistantAgent(
name="weather_agent",
model_client=OpenAIChatCompletionClient(
model="gpt-4o-mini",
api_key=os.getenv("OPENAI_API_KEY"),
),
tools=[get_weather],
)

# 定义终止条件
termination = TextMentionTermination("TERMINATE")

    # 定义 Agent 团队
agent_team = RoundRobinGroupChat([weather_agent], termination_condition=termination)

# 运行团队并将消息流至控制台
stream = agent_team.run_stream(task="What is the weather in New York?")
await Console(stream)

asyncio.run(main())

código anterior

Definición de herramientaFunción de utilidad: get_weather es una función de utilidad de ejemplo que devuelve información meteorológica de la ciudad.
Definición de agente: Define el Agente usando AssistantAgent y establece el modelo de cliente a GPT-4o-mini de OpenAI. la clave API se carga desde el archivo .env.
Condiciones de rescisiónDefinir una condición de terminación a través de TextMentionTermination que termina la tarea cuando se menciona "TERMINATE".
Equipo de agentesRoundRobinGroupChat: Utilice RoundRobinGroupChat para crear un equipo de Agentes a los que se asignarán tareas mediante sondeo.

Después de ejecutar este código, la consola mostrará una salida similar a la siguiente:

5 LangGraph

LangGraph LangGraph es un marco de IA basado en nodos diseñado para construir sistemas multiagente que gestionan tareas complejas. Como parte del ecosistema LangChain, LangGraph es un marco de agentes estructurado en grafos. Los usuarios pueden construir flujos de trabajo lineales, jerárquicos y secuenciales a través de nodos y aristas. Entre ellos.Nodorepresenta la acción del Agente.Bordeque denota una transición entre acciones.Estadoes otra parte importante del Agente LangGraph.

Ventajas y principales características de LangGraph

libre y de código abiertoLangGraph es una biblioteca libre bajo la licencia MIT Open Source.
Soporte de streamingProporciona apoyo textual en streaming para mostrar los pasos intermedios y los procesos de pensamiento del Agente.
Opciones de implantaciónSoporta múltiples despliegues a gran escala y el rendimiento del Agente puede ser monitorizado a través de LangSmith. La opción Enterprise permite desplegar LangGraph íntegramente en la propia infraestructura del usuario.
Adaptación de la empresaReplit El uso de LangGraph para impulsar su AI Coding Agent demuestra la aplicabilidad empresarial de LangGraph.
alto rendimientoSin carga adicional de código cuando se trata de flujos de trabajo de agentes complejos.
Circulación y controlabilidadDefina fácilmente flujos de trabajo Multi-Agente que incluyan bucles y tenga un control total sobre el estado del Agente.
cosificaciónLangGraph guarda automáticamente el estado del Agente después de cada paso en el gráfico, y también soporta pausar y reanudar la ejecución del gráfico en cualquier punto.

Vaya a la siguiente dirección para descargar el código de muestra:

https://langchain-ai.github.io/langgraph/