Cours d'introduction à Microsoft AI Agent : Agentic RAG

Informations sur le coursPosté il y a 6 mois Cercle de partage de l'IA

10.1K 00

Ce cours offre une vue d'ensemble de la recherche agentique et de la génération augmentée (Agentic Retrieval-Augmented Generation). RAG), un paradigme d'IA émergent dans lequel les grands modèles de langage (LLM) planifient de manière autonome leurs prochaines actions tout en acquérant des informations à partir de sources externes. Contrairement au modèle statique "recherche puis lecture", la RAG agentique implique des appels itératifs aux LLM, entrecoupés d'appels d'outils ou de fonctions et de résultats structurés. Le système évalue les résultats, optimise la requête, fait appel à d'autres outils si nécessaire et poursuit ce cycle jusqu'à ce qu'une solution satisfaisante soit obtenue.

bref

Ce cours couvrira les sujets suivants :

Comprendre le RAG agentique. Découvrez le paradigme émergent de l'IA où les grands modèles de langage (LLM) planifient de manière autonome leurs prochaines actions tout en extrayant des informations de sources de données externes.
Maîtriser le modèle itératif "maker-checker". La compréhension de la boucle d'appels itératifs au LLM, entrecoupés d'appels d'outils ou de fonctions et de sorties structurées, vise à améliorer la correction et à traiter les requêtes mal formatées.
Explorer les applications pratiques. Identifier les scénarios dans lesquels Agentic RAG se distingue, tels que les environnements où l'exactitude est primordiale, les interactions complexes avec les bases de données et les flux de travail étendus.

objectif d'apprentissage

A l'issue de cette formation, vous saurez comment/comprendre :

Comprendre le RAG agentique. Découvrez le paradigme émergent de l'IA où les grands modèles de langage (LLM) planifient de manière autonome leurs prochaines actions tout en extrayant des informations de sources de données externes.
Le modèle itératif "maker-checker". Comprendre le concept d'appels itératifs aux boucles de LLM, entrecoupés d'appels d'outils ou de fonctions et de sorties structurées, conçus pour améliorer la correction et traiter les requêtes mal formatées.
Possède le processus de raisonnement de. Comprendre que le système possède la capacité de son processus de raisonnement à décider de la manière d'aborder un problème sans s'appuyer sur des chemins prédéfinis.
Flux de travail. Découvrez comment les modèles Agentic peuvent prendre des décisions indépendantes pour extraire des rapports sur les tendances du marché, identifier des données sur les concurrents, corréler des mesures de ventes internes, synthétiser des résultats et évaluer des stratégies.
Boucles itératives, intégration d'outils et mémoire. Comprendre comment les systèmes s'appuient sur des modèles d'interaction cyclique pour maintenir l'état et la mémoire à travers les étapes afin d'éviter les cycles répétitifs et de prendre des décisions éclairées.
Gestion des modes d'échec et autocorrection. Explorer les mécanismes robustes d'autocorrection du système, y compris l'itération et la réinterrogation, l'utilisation d'outils de diagnostic et la dépendance à l'égard de la supervision humaine.
Limites de l'agent. Comprendre les limites de la RAG agentique, en se concentrant sur l'autonomie spécifique au domaine, la dépendance à l'égard de l'infrastructure et le respect des garde-fous.
Cas pratiques et valeur ajoutée. Identifier les scénarios dans lesquels Agentic RAG se distingue, tels que les environnements où l'exactitude est primordiale, les interactions complexes avec les bases de données et les flux de travail étendus.
Gouvernance, transparence et confiance. Comprendre l'importance de la gouvernance et de la transparence, y compris le raisonnement explicable, le contrôle des préjugés et la surveillance humaine.

Qu'est-ce que le RAG agentique ?

La génération assistée par récupération agentique (RAG agentique) est un paradigme d'IA émergent dans lequel les grands modèles de langage (LLM) planifient de manière autonome leurs prochaines actions tout en extrayant des informations de sources externes. Contrairement au modèle statique "récupérer puis lire", la RAG agentique implique des appels itératifs aux LLM, entrecoupés d'appels d'outils ou de fonctions et de sorties structurées. Le système évalue les résultats, optimise la requête, fait appel à d'autres outils si nécessaire et poursuit ce cycle jusqu'à ce qu'une solution satisfaisante soit obtenue. Ce modèle itératif de "maker-checker" améliore la correction, gère les requêtes mal formatées et garantit des résultats de haute qualité.

Le système possède activement son processus de raisonnement, réécrivant les requêtes qui ont échoué, sélectionnant différentes méthodes de recherche et intégrant de multiples outils (par exemple, des recherches vectorielles dans Azure AI Search, des bases de données SQL ou des API personnalisées) avant de déterminer finalement sa réponse.La caractéristique distinctive d'un système agentique est sa capacité à posséder son processus de raisonnement. Les implémentations traditionnelles de RAG s'appuient sur des chemins prédéfinis, mais les systèmes agentiques déterminent de manière autonome l'ordre des étapes en fonction de la qualité des informations qu'ils trouvent.

Définition de la génération assistée par récupération agentique (RAG agentique)

La génération assistée par récupération agentique (RAG agentique) est un paradigme émergent dans le développement de l'IA, où les LLM ne se contentent pas d'extraire des informations de sources de données externes, mais planifient également de manière autonome leurs prochaines actions. Contrairement au modèle statique "récupérer puis lire" ou aux séquences de repérage élaborées, la RAG agentique implique des boucles d'appel itératives aux LLM, entrecoupées d'appels d'outils ou de fonctions et de sorties structurées. À chaque étape, le système évalue les résultats obtenus, décide d'optimiser ou non sa requête, appelle d'autres outils si nécessaire et poursuit ce cycle jusqu'à l'obtention d'une solution satisfaisante.

Cette approche itérative "maker-checker" est conçue pour améliorer la correction, gérer les requêtes mal formatées vers des bases de données structurées (par exemple, NL2SQL) et garantir des résultats équilibrés et de haute qualité. Plutôt que de s'appuyer uniquement sur des chaînes d'indices élaborées, le système est activement propriétaire de son processus de raisonnement. Il peut réécrire les requêtes qui ont échoué, sélectionner différentes méthodes de recherche et intégrer plusieurs outils (par exemple, des recherches vectorielles dans Azure AI Search, des bases de données SQL ou des API personnalisées) avant de finaliser sa réponse. Il n'est donc pas nécessaire d'avoir recours à des cadres d'orchestration trop complexes. Au lieu de cela, une boucle relativement simple "appel LLM → utilisation de l'outil → appel LLM → ..." peut produire une sortie complexe et bien raisonnée.

S'approprier le processus de raisonnement

La caractéristique distinctive qui rend un système "agentique" est sa capacité à avoir son propre processus de raisonnement. Les implémentations traditionnelles de RAG s'appuient souvent sur les humains pour prédéfinir le chemin du modèle : une chaîne de pensée décrivant ce qu'il faut récupérer et quand. Mais lorsqu'un système est véritablement agentique, il décide en interne de la manière d'aborder un problème. Il ne se contente pas d'exécuter des scripts ; il détermine de manière autonome l'ordre des étapes en fonction de la qualité des informations qu'il trouve. Par exemple, si on lui demande de créer une stratégie de lancement de produit, il ne se contentera pas d'une invite qui détaille l'ensemble du processus de recherche et de prise de décision. Au lieu de cela, le modèle Agentic décide de manière autonome :

Utilisez Bing Web Grounding pour obtenir des rapports sur les tendances actuelles du marché.
Utilisez Azure AI Search pour identifier les données pertinentes sur les concurrents.
Utilisez Azure SQL Database pour associer des données historiques sur les ventes internes.
Synthétiser les analyses en stratégies cohérentes avec Azure OpenAI Service.
Les stratégies sont évaluées pour détecter les lacunes ou les incohérences et un nouveau cycle de recherche est lancé si nécessaire. Toutes ces étapes (optimisation de la requête, sélection des sources, itération jusqu'à ce que la réponse soit "satisfaisante") sont déterminées par le modèle, et non pré-rédigées par des humains.

Boucles itératives, intégration d'outils et mémoire

Le système Agentic repose sur un modèle d'interaction cyclique :

Appel initial. Les objectifs de l'utilisateur (c'est-à-dire les invites de l'utilisateur) sont présentés au LLM.
Appel à outils. Si le modèle identifie des informations manquantes ou des instructions ambiguës, il sélectionne un outil ou une méthode de recherche (par exemple, une requête de base de données vectorielle (par exemple, la recherche hybride de données privées d'Azure AI Search) ou un appel SQL structuré) pour rassembler plus de contexte.
Évaluation et optimisation. Après avoir examiné les données renvoyées, le modèle décide s'il y a suffisamment d'informations. Si ce n'est pas le cas, il optimisera la requête, essaiera d'autres outils ou ajustera son approche.
Répétez l'opération jusqu'à ce que vous soyez satisfait. Ce cycle se poursuit jusqu'à ce que le modèle détermine qu'il dispose de suffisamment de clarté et de preuves pour fournir une réponse finale bien motivée.
Mémoire et état. Comme le système conserve un état et une mémoire tout au long des étapes, il peut se souvenir des tentatives précédentes et de leurs résultats, ce qui lui permet d'éviter les cycles répétitifs et de prendre des décisions plus éclairées au fur et à mesure qu'il avance.

Au fil du temps, cela crée un sentiment évolutif de compréhension qui permet au modèle de gérer des tâches complexes en plusieurs étapes sans nécessiter d'intervention humaine continue ou de redéfinition des indices.

Gestion des modes d'échec et autocorrection

L'autonomie du RAG agentique comprend également un puissant mécanisme d'autocorrection. Lorsque le système se trouve dans une impasse (par exemple, lorsqu'il récupère un document non pertinent ou qu'il rencontre une requête mal formatée), il peut.. :

Itération et requêtes. Au lieu de renvoyer des réponses de faible valeur, le modèle essaie de nouvelles stratégies de recherche, réécrit les requêtes de la base de données ou examine d'autres ensembles de données.
Utilisation d'outils de diagnostic. Le système peut appeler des fonctions supplémentaires conçues pour l'aider à déboguer ses étapes d'inférence ou à confirmer l'exactitude des données récupérées. Des outils tels que Azure AI Tracing contribueront à assurer une observabilité et un suivi solides.
Dépendance à l'égard de la supervision manuelle. En cas de risque élevé ou d'échecs répétés, le modèle peut signaler une incertitude et demander une assistance humaine. Une fois que l'homme a fourni un retour d'information correctif, le modèle peut adopter l'expérience à l'avenir.

Cette approche itérative et dynamique permet une amélioration continue du modèle, garantissant qu'il ne s'agit pas d'un système unique, mais d'un système capable d'apprendre des erreurs commises au cours d'une session donnée.

Limites de l'agent

Bien que le RAG agentique soit autonome dans ses tâches, il n'est pas équivalent à l'IA polyvalente. Ses capacités "agentiques" sont limitées aux outils, aux sources de données et aux politiques fournis par les développeurs humains. Il ne peut pas inventer ses propres outils ou dépasser les limites d'un domaine donné. En revanche, elle excelle dans l'orchestration dynamique des ressources disponibles. Les principales différences avec les formes plus avancées d'IA sont les suivantes :

Autonomie dans des domaines spécifiques. Les systèmes de RAG agentiques se concentrent sur la réalisation d'objectifs définis par l'utilisateur dans des domaines connus, en utilisant des stratégies telles que la réécriture de requêtes ou la sélection d'outils pour améliorer les résultats.
Dépendances en matière d'infrastructure. La capacité du système dépend des outils et des données que les développeurs intègrent. Il ne peut dépasser ces limites sans intervention humaine.
Respect de la glissière de sécurité. Le code de déontologie, les règles de conformité et la stratégie commerciale restent très importants. La liberté de l'agent est toujours soumise à des mesures de sécurité et à des mécanismes de contrôle (espérons-le ?).

Cas d'utilisation pratiques et valeur ajoutée

Agentic RAG brille dans les scénarios qui nécessitent une optimisation itérative et de la précision :

"Un environnement où l'exactitude prime. Lors de contrôles de conformité, d'analyses réglementaires ou de recherches juridiques, les modèles agentiques peuvent vérifier les faits de manière itérative, consulter plusieurs sources et réécrire les requêtes jusqu'à ce qu'une réponse minutieusement vérifiée soit générée.
Interactions complexes entre bases de données. Lorsqu'ils travaillent avec des données structurées, où les requêtes peuvent souvent échouer ou avoir besoin d'être ajustées, les systèmes peuvent utiliser Azure SQL ou Microsoft Fabric OneLake pour optimiser de manière autonome leurs requêtes afin de s'assurer que la recherche finale correspond à l'intention de l'utilisateur.
Flux de travail étendu. Les sessions plus longues peuvent être modifiées au fur et à mesure que de nouvelles informations sont disponibles, et Agentic RAG peut continuellement intégrer de nouvelles données, en modifiant les stratégies au fur et à mesure que l'on en apprend plus sur l'espace du problème.

Gouvernance, transparence et confiance

Ces systèmes devenant de plus en plus autonomes dans leur raisonnement, la gouvernance et la transparence sont essentielles :

Raisonnement interprétatif. Les modèles peuvent fournir une piste d'audit des requêtes qu'ils effectuent, des sources qu'ils consultent et des étapes de raisonnement qu'ils suivent pour parvenir à leurs conclusions.Des outils tels que Azure AI Content Safety et Azure AI Tracing / GenAIOps peuvent aider à maintenir la transparence et à atténuer les risques.
Contrôle de la déviation et récupération de l'équilibre. Les développeurs peuvent ajuster les stratégies de recherche pour s'assurer que des sources de données équilibrées et représentatives sont prises en compte, et utiliser Azure Machine Learning pour personnaliser les modèles pour les organisations de science des données avancées, en vérifiant régulièrement les résultats pour détecter les biais ou les schémas biaisés.
Supervision manuelle et conformité. Le système Agentic RAG ne remplace pas le jugement manuel dans la prise de décision à haut risque, mais le complète en offrant la possibilité d'un examen plus approfondi.

Il est essentiel de disposer d'outils qui fournissent un enregistrement clair des opérations. Sans eux, il peut être très difficile de déboguer un processus à plusieurs étapes. Voir Literal AI (la société à l'origine de Chainlit) pour un exemple d'exécution d'un agent :

rendre un verdict

Le RAG agentique représente une évolution naturelle dans la manière dont les systèmes d'intelligence artificielle abordent les tâches complexes à forte intensité de données. En adoptant un modèle d'interaction cyclique, en sélectionnant de manière autonome les outils et en optimisant les requêtes jusqu'à l'obtention de résultats de haute qualité, les systèmes passent d'un suivi statique des invites à des décideurs plus adaptatifs et conscients du contexte. Bien que toujours liées à des infrastructures et à une éthique définies par l'homme, ces capacités agentiques offrent des interactions d'IA plus riches, plus dynamiques et, en fin de compte, plus utiles pour les entreprises et les utilisateurs finaux.