Les 5 principaux cadres d'agents d'IA qui valent la peine d'être découverts en 2025

Base de connaissances sur l'IAPosté il y a 8 mois Cercle de partage de l'IA

12.4K 00

Agent La traduction la plus courante que j'ai vue jusqu'à présent est "corps intelligent", mais la traduction directe est "agent".

Quelle est la traduction d'Agentic ? Je pense que quelque chose comme "agentic" serait plus approprié.

Afin de ne pas semer la confusion dans l'esprit du lecteur, j'utiliserai directement l'anglais dans cet article.

Avec l'évolution des LLM, les capacités des IA ne se limitent plus à l'automatisation de tâches simples ; elles peuvent gérer des flux de travail complexes et continus. Par exemple, nous pouvons utiliser les LLM pour créer des assistants intelligents qui commandent automatiquement des articles sur des plateformes de commerce électronique et organisent la livraison à la place de l'utilisateur. CesLes assistants basés sur le LLM sont connus sous le nom d'agents d'intelligence artificielle.

Pour être plus précis, un agent d'intelligence artificielle est un assistant intelligent piloté par LLM qui peut aider à effectuer des tâches et des outils spécifiques sur la base de tâches et d'outils prédéfinis. Dans sa forme la plus élémentaire, un agent d'intelligence artificielle présente les caractéristiques clés suivantes :

gestion de la mémoireL'agent d'intelligence artificielle peut stocker et gérer les enregistrements des interactions avec les utilisateurs.
Interaction avec les sources de données externesLa capacité à communiquer avec des systèmes externes afin d'obtenir des données ou d'accomplir des tâches.
exécution de la fonctionLe travail réel est effectué en appelant des fonctions.

À titre d'exemple, l'agent d'intelligence artificielle peut effectuer les tâches suivantes :

Réservations de restaurantsPar exemple, un agent d'intelligence artificielle dans un système de restauration peut aider les utilisateurs à réserver des places en ligne, à comparer différents restaurants et à les appeler directement grâce à l'interaction vocale.
Collaboration virtuelle CollèguesL'agent d'intelligence artificielle peut agir comme le "petit secrétaire" de votre projet, en collaborant avec les utilisateurs sur des tâches spécifiques.
Automatisation des opérations quotidiennesLes agents d'IA sont capables de gérer des opérations en plusieurs étapes et même d'effectuer des opérations informatiques quotidiennes. Par exemple, l'agent Replit peut simuler les opérations que les développeurs effectuent dans un environnement de développement, en installant automatiquement les dépendances et en éditant le code. Ordinateur L'agent d'utilisation peut guider Claude Utiliser l'ordinateur de manière courante, notamment en déplaçant la souris, en cliquant sur des boutons et en saisissant du texte.

Alors que nous pouvons construire des agents d'IA à partir de zéro en utilisant des piles technologiques comme Python, React, etc., il est possible de construire des agents d'IA à partir de zéro avec l'aide de technologies comme Phidata, OpenAI Swarm, LangGraph, Microsoft Autogen, CrewAI, Vertex AI et.... Langflow Le processus de développement devient plus efficace avec des frameworks multi-agents tels que AI Assistant. Ces frameworks fournissent des outils et des fonctionnalités pré-packagés pour nous aider à construire rapidement des assistants d'IA.

Quels sont donc les avantages de l'utilisation de ces cadres ?

Choisir le bon LLMVous pouvez utiliser des LLM tels que OpenAI, Anthropic, xAI, Mistral, etc., en fonction du scénario d'application spécifique, ou des LLM tels que Ollama et des outils tels que LM Studio pour créer des agents d'intelligence artificielle.
Ajouter une base de connaissancesCes cadres vous permettent d'ajouter des documents spécifiques (tels que des fichiers json, pdf ou des sites web) en tant que bases de connaissances pour aider l'agent d'IA à acquérir et à comprendre des informations.
Fonction de mémoire intégréeIl n'est pas nécessaire de créer des systèmes complexes pour stocker et gérer les journaux de conversation ou les conversations personnalisées. Le cadre est doté d'une fonction de mémoire qui aide l'agent d'intelligence artificielle à se souvenir des interactions précédentes et à y accéder au fil du temps.
Outils de personnalisationLe cadre multi-agent nous permet d'ajouter des outils personnalisés à l'agent d'intelligence artificielle et de l'intégrer de manière transparente à des systèmes externes pour effectuer des opérations telles que des paiements en ligne, des recherches sur le web, des appels d'API, des consultations de bases de données, la visualisation de vidéos, l'envoi d'e-mails, etc.
Simplifier les défis de l'ingénierieCes cadres nous aident à simplifier des tâches d'ingénierie complexes, telles que la gestion des connaissances et de la mémoire, réduisant ainsi les difficultés techniques lors du développement de produits d'IA.
Développement et déploiement accélérésLe cadre fournit les outils et l'infrastructure nécessaires pour construire des systèmes d'IA, ce qui nous aide à développer et à déployer plus rapidement des systèmes d'IA sur des plates-formes en nuage telles qu'AWS.

Grâce à ces cadres, nous pouvons plus facilement développer des agents d'intelligence artificielle efficaces et intelligents afin d'améliorer la vitesse et la qualité du développement des produits.

Ensuite, nous nous pencherons sur les cinq principales plateformes de création d'agents d'intelligence artificielle pour vous aider à démarrer et à créer votre propre assistant d'intelligence artificielle !

La structure de base d'un agent

La définition d'un agent d'intelligence artificielle peut inclure un choix de modèles de langage, de mémoire, de stockage, de sources de connaissances externes, de bases de données vectorielles, d'instructions, de descriptions, de noms, etc.

Par exemple, quelque chose comme Planche à voile Un agent d'IA moderne comme celui-ci peut aider n'importe qui à générer, exécuter, éditer, construire et déployer rapidement des applications web complètes. Il prend en charge la génération de code et la construction d'applications pour un large éventail de technologies web et de bases de données, telles que Astro, Vite, Next.js, Superbase, et bien d'autres encore.

Cas d'application de l'approche multi-agents dans les entreprises

Les systèmes d'IA agentique ont un large éventail d'applications dans les environnements d'entreprise.Particulièrement dans l'exécution de tâches automatisées et répétitives. Voici les principaux scénarios d'application dans lesquels l'agent d'IA est utile dans l'espace de l'entreprise :

Analyse des appels et autres analysesLes systèmes multi-agents excellent dans l'analyse et l'établissement de rapports sur les intentions, les données démographiques et les interactions des utilisateurs. Leurs capacités d'analyse et de rapport aident les organisations à cibler les clients ou les marchés.
Classification des appelsLes appels sont automatiquement classés en fonction de la bande passante et de la puissance du réseau des participants, pour un traitement efficace.
Écoute du marchéLes services d'assistance à la clientèle : surveiller et analyser le sentiment des clients dans les applications du marché.
Analyse des enquêtes et des commentairesLes clients ont besoin d'être informés de leurs réactions et des résultats de leurs enquêtes pour mieux comprendre et améliorer leur expérience.
Gestion des voyages et des dépensesLes dépenses : Automatiser la déclaration, le suivi et l'approbation des dépenses.
Dialogue bancaireLes assistants vocaux : Aider les clients à effectuer des opérations bancaires par le biais d'un chat ou d'un assistant vocal alimenté par l'IA.
L'IA universelle prend en charge les chatbotsLes agents d'assistance à la clientèle peuvent traiter les réclamations des clients, résoudre les problèmes et déléguer des tâches complexes à d'autres agents.
financièreL'agent financier peut être utilisé pour prévoir les tendances économiques, boursières et de marché et fournir des conseils pratiques en matière d'investissement.
marchéLes équipes marketing des entreprises peuvent utiliser des agents d'intelligence artificielle pour créer des contenus et des textes publicitaires personnalisés pour différents publics cibles afin d'augmenter les taux de conversion.
ventes (représentant, accord, etc.)L'agent d'intelligence artificielle peut aider à analyser les modèles d'interaction avec les clients dans le système et aider les équipes de vente à se concentrer sur la conversion des clients potentiels.
compétenceDans l'industrie technologique, AI Coding Agent aide les développeurs et les ingénieurs à devenir plus productifs en accélérant l'achèvement du code, la génération, l'automatisation, les tests et la correction des bogues.

2024 Cadre des cinq agents

Vous pouvez utiliser plusieurs frameworks Python pour créer et ajouter des agents aux applications et aux services. Ces frameworks comprennent des outils sans code (constructeurs visuels d'agents d'IA), à faible code et à code moyen. Je vais maintenant vous présenter cinq des meilleurs constructeurs d'agents basés sur Python de 2024, afin que vous soyez libre de choisir en fonction de vos besoins professionnels.

1 Phidata

Phidata est un framework basé sur Python pour transformer les LLM en agents dans les produits d'IA, supportant les LLM open-source et fermés d'acteurs majeurs tels que OpenAI, Anthropic, Cohere, Ollama et Ensemble AI et plus encore. Grâce à son support pour les bases de données et les magasins vectoriels, nous pouvons facilement connecter les systèmes d'IA à Postgres, PgVector, Pinecone, LanceDb, et plus encore. Avec Phidata, nous pouvons construire des agents de base, ainsi que créer des agents avancés avec des appels de fonction, des sorties structurées et un réglage fin.

Principales caractéristiques de Phidata

Interface utilisateur intégrée pour les agentsPhidata fournit une interface utilisateur prête à l'emploi pour exécuter des projets d'agents localement ou dans le nuage et gérer les sessions en arrière-plan.
déploiementsVous pouvez publier l'agent sur GitHub ou tout autre service en nuage, ou vous pouvez connecter un compte AWS pour le déployer dans un environnement de production.
Suivi des indicateurs clésLe système d'information de l'Agent : Il fournit des instantanés de session, des appels d'API, l'utilisation de jetons, et prend en charge le réglage des paramètres et l'amélioration de l'Agent.
Soutien aux modèlesAccélérer le processus de développement et de production d'agents d'intelligence artificielle grâce à des modèles de base de code préconfigurés.
Soutenir AWSPhidata s'intègre parfaitement à AWS et peut exécuter des applications complètes sur des comptes AWS.
Indépendance du modèleLes services d'aide à l'utilisation des technologies les plus récentes d'OpenAI, d'Anthropic, de Groq et d'autres organismes de recherche et de développement. Mistral et d'autres modèles avancés et clés API.
Construire un système multi-agentsPhidata : En utilisant Phidata, vous pouvez créer une équipe d'agents qui se transmettent des tâches et collaborent sur des tâches complexes ; Phidata gère de manière transparente la coordination des agents en arrière-plan.

Je vais maintenant vous montrer comment utiliser le cadre Phidata et le LLM d'OpenAI pour construire un agent d'IA de base en Python qui interroge les données financières de Yahoo Finance, qui est conçu pour agréger les recommandations des analystes de diverses entreprises par le biais de Yahoo Finance.

Installer les dépendances :

Créer un nouveau fichier financial_agent.py :

import openai
from phi.agent import Agent
from phi.model.openai import OpenAIChat
from phi.tools.yfinance import YFinanceTools
from dotenv import load_dotenv
import os


# 从 .env 文件加载环境变量
load_dotenv()


# 从环境中获取 API 密钥
openai.api_key = os.getenv("OPENAI_API_KEY")


# 初始化 Agent 
finance_agent = Agent(
name="Finance AI Agent",
model=OpenAIChat(id="gpt-4o"),
tools=[
YFinanceTools(
stock_price=True,
analyst_recommendations=True,
company_info=True,
company_news=True,
)
],
instructions=["Use tables to display data"],
show_tool_calls=True,
markdown=True,
)


# 输出分析师对 NVDA 的推荐摘要
finance_agent.print_response("Summarize analyst recommendations for NVDA", stream=True)

Code ci-dessus :

Importation de modules et chargement de clés API
Tout d'abord, il faut importer les modules et paquets nécessaires et charger la clé API d'OpenAI via le fichier .env. Ce chargement des clés API s'applique également à d'autres fournisseurs de modèles tels que Anthropic, Mistral et Groq.
Création d'un proxy
Utilisez la classe Agent de Phidata pour créer un nouvel agent et spécifier ses fonctions et caractéristiques uniques, y compris les modèles, les outils, les commandes, etc.
Imprimer la réponse
Appelez la méthode print_response pour obtenir la réponse de l'agent à la question et indiquez si elle doit être affichée sous forme de flux (stream=True).

2 Essaim

Essaim OpenAI a récemment publié un cadre expérimental d'agents open source, qui est un cadre d'orchestration multi-agents léger.

prendre noteSwarm est encore en phase expérimentale. Il peut être utilisé à des fins de développement et d'éducation, mais n'est pas recommandé pour les environnements de production. Pour les dernières informations, vous pouvez vous référer au dépôt officiel :

https://github.com/openai/swarm

Utilisation de l'essaim Agents répondre en chantant Transferts En tant qu'abstraction pour l'orchestration et la coordination des agents, il s'agit d'un cadre léger, facile à tester et à gérer. Les agents Swarm peuvent être configurés avec des outils, des commandes et d'autres paramètres pour effectuer des tâches spécifiques.

Outre son architecture légère et simple, Swarm présente les caractéristiques suivantes :

transmettre à la génération suivanteSwarm permet la construction de systèmes multi-agents, dans lesquels un agent peut à tout moment transmettre des conversations à d'autres agents.
évolutivitéSwarm : Grâce à son architecture de transfert simplifiée, Swarm facilite la mise en place de systèmes d'agents capables de prendre en charge des millions d'utilisateurs.
évolutivitéSwarm est conçu pour être hautement personnalisable et peut être utilisé pour créer une expérience d'agent entièrement personnalisée.
Système de récupération intégré et gestion de la mémoireSwarm est doté d'une fonctionnalité intégrée pour le stockage et le traitement du contenu du dialogue.
Vie privéeSwarm fonctionne principalement du côté client et ne conserve pas d'état entre les appels, ce qui améliore considérablement la confidentialité des données.
ressources éducativesSwarm fournit une série d'exemples d'applications multi-agents de base ou avancées, que les développeurs peuvent tester et dont ils peuvent s'inspirer.

Ensuite, je vous montrerai comment utiliser Swarm :

from swarm import Swarm, Agent

# 初始化 Swarm 客户端
client = Swarm()
mini_model = "gpt-4o-mini"

# 定义协调函数，用于将任务交接给 Agent B
def transfer_to_agent_b():
return agent_b

# 定义 Agent A
agent_a = Agent(
name="Agent A",
instructions="You are a helpful assistant.",
functions=[transfer_to_agent_b],
)

# 定义 Agent B
agent_b = Agent(
name="Agent B",
model=mini_model,
instructions="You speak only in Finnish.",
)

# 运行 Agent 系统并获取响应
response = client.run(
agent=agent_a,
messages=[{"role": "user", "content": "I want to talk to Agent B."}],
debug=False,
)

# 打印 Agent B 的响应
print(response.messages[-1]["content"])

code ci-dessus

1. initialisation
  - Swarm est utilisé pour créer une instance de client.
  - Agent définit le nom, la fonction et le modèle linguistique de l'agent (par exemple, gpt-4o-mini).
2. logique de transition

transfer_to_agent_b est une fonction de coordination qui transfère les tâches de l'agent_a à l'agent_b.

1. Fonctionnement du système d'agents

client.run() exécute le système d'agents, en transmettant les messages et les paramètres de débogage pour suivre l'exécution de la tâche.

Si vous changez la langue de la commande pour l'agent_b en une autre langue (par exemple, anglais, suédois, finnois), vous obtiendrez une réponse dans la langue correspondante.

3 CrewAI

CrewAI L'un des frameworks d'IA basés sur des agents les plus populaires pour construire rapidement des agents d'IA et les intégrer dans les derniers LLM et bases de code. De grandes entreprises comme Oracle, Deloitte, Accenture et d'autres utilisent CrewAI et lui font confiance.

CrewAI est plus riche et plus polyvalent que d'autres cadres basés sur des agents.

évolutivitéPrise en charge de l'intégration avec plus de 700 applications, dont Notion, Zoom, Stripe, Mailchimp, Airtable, etc.
artefact
- Les développeurs peuvent utiliser le cadre CrewAI pour construire des systèmes d'automatisation multi-agents à partir de zéro.
- Les concepteurs peuvent créer des agents entièrement fonctionnels dans un environnement sans code grâce à son studio d'interface utilisateur et à ses outils de modélisation.
déploiementsVous pouvez utiliser la méthode de déploiement de votre choix pour migrer rapidement votre agent de développement vers l'environnement de production.
Suivi des agentsComme Phidata, CrewAI fournit des tableaux de bord intuitifs pour le suivi des progrès et des performances des agents.
Outils de formation intégrésUtilisez les outils de formation et de test intégrés à CrewAI pour améliorer les performances et l'efficacité de l'agent et garantir la qualité de ses réponses.

Nous devons d'abord installer CrewAI :

La commande ci-dessus installe CrewAI et ses outils et vérifie que l'installation a réussi.

Une fois l'installation terminée, vous pouvez exécuter la commande suivante pour créer un nouveau projet CrewAI :

Après avoir exécuté cette commande, nous serons invités à sélectionner un fournisseur de modèle dans la liste suivante, par exemple OpenAI, Anthropic, xAI, Mistral, etc. Après avoir sélectionné un fournisseur, vous pouvez également sélectionner un modèle spécifique dans la liste, par exemple gpt-4o-mini.

Les commandes suivantes peuvent être utilisées pour créer un système multi-agents :

L'application CrewAI complète a été téléchargée sur un dépôt GitHub et peut être téléchargée et exécutée à l'aide de la commande suivante :

https://github.com/GetStream/stream-tutorial-projects/tree/main/AI/Multi-Agent-AI

Après l'avoir exécuté, vous obtiendrez une réponse similaire à la suivante :

4 Autogène

Autogène est un cadre open source pour la construction de systèmes d'agents. Grâce à ce cadre, vous pouvez créer une collaboration multi-agents et des flux de travail LLM.

Autogen est doté des principales caractéristiques suivantes :

Prise en charge des langues étrangèresConstruire des agents en utilisant des langages de programmation tels que Python et .
Agent localLes agents peuvent être gérés et expérimentés localement afin de garantir une plus grande confidentialité.
communication de messages asynchronesUtiliser des messages asynchrones pour la communication entre les agents.
évolutivitéAide les développeurs à mettre en place des réseaux d'agents distribués pour la collaboration entre organisations.
PersonnalisationPersonnalisez et construisez un système d'agent entièrement personnalisé grâce à ses composants enfichables.

Le bloc de code suivant construit un système simple d'agent météorologique IA :

import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_agentchat.task import Console, TextMentionTermination
from autogen_agentchat.teams import RoundRobinGroupChat
from autogen_ext.models import OpenAIChatCompletionClient

import os
from dotenv import load_dotenv

load_dotenv()

# 定义工具
async def get_weather(city: str) -> str:
return f"The weather in {city} is 73 degrees and Sunny."

async def main() -> None:
# 定义 Agent
weather_agent = AssistantAgent(
name="weather_agent",
model_client=OpenAIChatCompletionClient(
model="gpt-4o-mini",
api_key=os.getenv("OPENAI_API_KEY"),
),
tools=[get_weather],
)

# 定义终止条件
termination = TextMentionTermination("TERMINATE")

    # 定义 Agent 团队
agent_team = RoundRobinGroupChat([weather_agent], termination_condition=termination)

# 运行团队并将消息流至控制台
stream = agent_team.run_stream(task="What is the weather in New York?")
await Console(stream)

asyncio.run(main())

code ci-dessus

Définition de l'outilget_weather est un exemple de fonction d'utilité qui renvoie des informations sur la météo d'une ville.
Définition de l'agentDéfinir l'agent en utilisant AssistantAgent et définir le modèle de client à OpenAI GPT-4o-mini. La clé API est chargée à partir du fichier .env.
Conditions de résiliationDéfinir une condition de terminaison via TextMentionTermination qui met fin à la tâche lorsque le mot "TERMINATE" est mentionné.
Équipe d'agentsLe groupe de discussion RoundRobin : Utilisez RoundRobinGroupChat pour créer une équipe d'agents qui se verront assigner des tâches par sondage.

Après avoir exécuté ce code, la console affichera une sortie similaire à la suivante :

5 LangGraph

LangGraph LangGraph est un cadre d'IA basé sur les nœuds, conçu pour construire des systèmes multi-agents qui gèrent des tâches complexes. Faisant partie de l'écosystème LangChain, LangGraph est un cadre d'agent structuré en graphe. Les utilisateurs peuvent construire des flux de travail linéaires, hiérarchiques et séquentiels à l'aide de nœuds et d'arêtes. Parmi ces flux, on peut citerNœudreprésente l'action de l'agent.Borddénotant les transitions entre les actions.Étatest un autre élément important de l'agent LangGraph.

Avantages et caractéristiques principales de LangGraph

libre et gratuitLangGraph est une bibliothèque libre sous la licence MIT Open Source.
Prise en charge de la diffusion en continuFournit un support textuel en continu pour montrer les étapes intermédiaires et les processus de réflexion de l'agent.
Options de déploiementDe multiples déploiements à grande échelle sont possibles, et les performances des agents peuvent être contrôlées par LangSmith. L'option Entreprise permet de déployer LangGraph entièrement sur l'infrastructure de l'utilisateur.
Adaptation de l'entrepriseReplit L'utilisation de LangGraph pour alimenter son agent de codage de l'IA démontre l'applicabilité de LangGraph dans les entreprises.
haute performancePas de code supplémentaire pour les flux de travail complexes des agents.
Circulation et contrôlabilitéDéfinissez facilement des flux de travail multi-agents comprenant des boucles et contrôlez entièrement l'état de l'agent.
objectivationLangGraph enregistre automatiquement l'état de l'agent après chaque étape du graphe, et permet également de mettre en pause et de reprendre l'exécution du graphe à n'importe quel moment.

Allez à l'adresse ci-dessous pour télécharger l'exemple de code :

https://langchain-ai.github.io/langgraph/