Microsoft AI Agent Einführungskurs: Agentic RAG

Informationen zum KursGeschrieben vor 6 Monaten AI-Austauschkreis

2.1K 00

Dieser Kurs bietet einen umfassenden Überblick über Agentic Retrieval-Augmented Generation (Agentic RAG), ein aufkommendes KI-Paradigma, bei dem große Sprachmodelle (Large Language Models, LLMs) autonom ihre nächsten Aktionen planen, während sie Informationen aus externen Quellen erhalten. Im Gegensatz zum statischen "Suchen-und-Lesen"-Modell beinhaltet Agentic RAG iterative Aufrufe an LLMs, die mit Tool- oder Funktionsaufrufen und strukturierten Ausgaben unterbrochen werden. Das System wertet die Ergebnisse aus, optimiert die Abfrage, ruft bei Bedarf weitere Tools auf und setzt diesen Zyklus fort, bis eine zufriedenstellende Lösung erreicht ist.

kurz

In diesem Kurs werden die folgenden Themen behandelt:

Die Agentische RAG verstehen. Erfahren Sie mehr über das neue Paradigma in der KI, bei dem Large Language Models (LLMs) autonom ihre nächsten Schritte planen, während sie Informationen aus externen Datenquellen extrahieren.
Beherrschung des iterativen "Maker-Checker"-Modells. Das Verständnis der Schleife von iterativen Aufrufen des LLM, durchsetzt mit Werkzeug- oder Funktionsaufrufen und strukturierten Ausgaben, soll die Korrektheit verbessern und schlecht formatierte Abfragen bewältigen.
Erkunden Sie praktische Anwendungen. Identifizieren Sie Szenarien, in denen Agentic RAG glänzt, wie z.B. "correctness-first"-Umgebungen, komplexe Datenbankinteraktionen und erweiterte Workflows.

Lernziel

Nach Abschluss dieses Kurses werden Sie wissen, wie man es macht/versteht:

Die Agentische RAG verstehen. Erfahren Sie mehr über das neue Paradigma in der KI, bei dem Large Language Models (LLMs) autonom ihre nächsten Schritte planen, während sie Informationen aus externen Datenquellen extrahieren.
Das iterative "Maker-Checker"-Modell. Begreifen des Konzepts der iterativen Aufrufe von LLM-Schleifen, durchsetzt mit Tool- oder Funktionsaufrufen und strukturierten Ausgaben, um die Korrektheit zu verbessern und mit schlecht formatierten Abfragen umzugehen.
Verfügt über die Fähigkeit zum logischen Denken. Das Verständnis, dass das System über die Fähigkeit seines Denkprozesses verfügt, zu entscheiden, wie ein Problem anzugehen ist, ohne sich auf vordefinierte Pfade zu verlassen.
Arbeitsablauf. Erfahren Sie, wie Agentic-Modelle unabhängige Entscheidungen treffen können, um Markttrendberichte abzurufen, Konkurrenzdaten zu ermitteln, interne Verkaufsmetriken zu korrelieren, Ergebnisse zusammenzufassen und Strategien zu bewerten.
Iterative Schleifen, Werkzeugintegration und Speicher. Verstehen, wie Systeme auf zyklische Interaktionsmuster angewiesen sind, um den Zustand und das Gedächtnis über mehrere Schritte hinweg aufrechtzuerhalten, um sich wiederholende Zyklen zu vermeiden und fundierte Entscheidungen zu treffen.
Umgang mit Fehlermöglichkeiten und Selbstkorrektur. Untersuchung der robusten Selbstkorrekturmechanismen des Systems, einschließlich Iteration und Neuabfrage, Einsatz von Diagnosewerkzeugen und Abhängigkeit von menschlicher Aufsicht.
Die Grenzen des Agenten. Verstehen der Grenzen von Agentic RAG mit Schwerpunkt auf domänenspezifischer Autonomie, Infrastrukturabhängigkeit und Einhaltung von Leitplanken.
Praktische Anwendungsfälle und Nutzen. Identifizieren Sie Szenarien, in denen Agentic RAG glänzt, wie z.B. "correctness-first"-Umgebungen, komplexe Datenbankinteraktionen und erweiterte Workflows.
Governance, Transparenz und Vertrauen. Verständnis für die Bedeutung von Governance und Transparenz, einschließlich erklärbarer Argumente, Kontrolle von Vorurteilen und menschlicher Aufsicht.

Was ist Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) ist ein aufkommendes KI-Paradigma, bei dem Large Language Models (LLMs) autonom ihre nächsten Aktionen planen, während sie Informationen aus externen Quellen extrahieren. Im Gegensatz zum statischen "Abrufen-und-einlesen"-Modell beinhaltet Agentic RAG iterative Aufrufe an LLMs, die mit Tool- oder Funktionsaufrufen und strukturierten Ausgaben unterbrochen werden. Das System wertet die Ergebnisse aus, optimiert die Abfrage, ruft bei Bedarf weitere Tools auf und setzt diesen Zyklus fort, bis eine zufriedenstellende Lösung erreicht ist. Dieses iterative "Maker-Checker"-Modell verbessert die Korrektheit, bewältigt schlecht formatierte Abfragen und gewährleistet qualitativ hochwertige Ergebnisse.

Das System steuert aktiv seinen Denkprozess, indem es fehlgeschlagene Abfragen umschreibt, verschiedene Abfragemethoden auswählt und mehrere Tools integriert (z. B. Vektorsuchen in Azure AI Search, SQL-Datenbanken oder benutzerdefinierte APIs), bevor es schließlich seine Antwort festlegt.Das Unterscheidungsmerkmal eines agentenbasierten Systems ist, dass es in der Lage ist, seinen Denkprozess zu steuern. Traditionelle RAG-Implementierungen verlassen sich auf vordefinierte Pfade, aber agentenbasierte Systeme bestimmen die Reihenfolge der Schritte autonom auf der Grundlage der Qualität der gefundenen Informationen.

Definition Agentische Retrieval-Augmented Generation (Agentische RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) ist ein aufkommendes Paradigma in der KI-Entwicklung, bei dem LLMs nicht nur Informationen aus externen Datenquellen extrahieren, sondern auch autonom ihre nächsten Aktionen planen. Im Gegensatz zum statischen "retrieve-then-read"-Modell oder zu aufwendigen Cueing-Sequenzen beinhaltet Agentic RAG iterative Aufrufschleifen zu LLMs, die mit Tool- oder Funktionsaufrufen und strukturierten Ausgaben durchsetzt sind. Bei jedem Schritt wertet das System die erhaltenen Ergebnisse aus, entscheidet, ob die Abfrage optimiert werden soll oder nicht, ruft bei Bedarf weitere Tools auf und setzt diesen Zyklus fort, bis eine zufriedenstellende Lösung erreicht ist.

Dieser iterative "Maker-Checker"-Ansatz wurde entwickelt, um die Korrektheit zu verbessern, schlecht formatierte Abfragen an strukturierte Datenbanken (z. B. NL2SQL) zu bewältigen und ausgewogene, hochwertige Ergebnisse zu gewährleisten. Das System verlässt sich nicht nur auf ausgeklügelte Hinweisketten, sondern ist aktiv an seinem Schlussfolgerungsprozess beteiligt. Es kann fehlgeschlagene Abfragen umschreiben, verschiedene Abfragemethoden auswählen und mehrere Tools integrieren (z. B. Vektorsuchen in Azure AI Search, SQL-Datenbanken oder benutzerdefinierte APIs), bevor es seine Antwort fertigstellt. Dadurch entfällt der Bedarf an übermäßig komplexen Orchestrierungs-Frameworks. Stattdessen kann eine relativ einfache Schleife "LLM-Aufruf → Toolnutzung → LLM-Aufruf → ..." komplexe und gut begründete Ergebnisse liefern.

Einen Denkprozess haben

Das Unterscheidungsmerkmal, das ein System "agentenbasiert" macht, ist seine Fähigkeit, seinen eigenen Denkprozess zu haben. Traditionelle RAG-Implementierungen verlassen sich oft auf den Menschen, um den Weg des Modells vorzugeben: eine Gedankenkette, die vorgibt, was wann abgerufen werden soll. Wenn ein System jedoch wirklich agentenbasiert ist, entscheidet es intern, wie es ein Problem angehen will. Es führt nicht einfach Skripte aus, sondern bestimmt die Reihenfolge der Schritte selbständig auf der Grundlage der Qualität der gefundenen Informationen. Wenn es beispielsweise aufgefordert wird, eine Strategie für die Produkteinführung zu erstellen, verlässt es sich nicht einfach auf eine Eingabeaufforderung, die den gesamten Forschungs- und Entscheidungsprozess detailliert beschreibt. Stattdessen entscheidet das agenturische Modell selbstständig:

Nutzen Sie Bing Web Grounding, um aktuelle Markttrendberichte abzurufen.
Verwenden Sie Azure AI Search, um relevante Wettbewerberdaten zu ermitteln.
Verwenden Sie Azure SQL Database, um historische Vertriebskennzahlen zu verknüpfen.
Mit dem Azure OpenAI Service können Sie Analysen zu kohärenten Strategien zusammenführen.
Die Strategien werden auf Lücken oder Inkonsistenzen hin ausgewertet, und gegebenenfalls wird eine weitere Suchrunde veranlasst. Alle diese Schritte (Optimierung der Anfrage, Auswahl der Quellen, Iteration bis zur "Zufriedenheit" mit der Antwort) werden vom Modell bestimmt und nicht von Menschen vorformuliert.

Iterative Schleifen, Werkzeugintegration und Speicher

Das Agentensystem stützt sich auf ein zyklisches Interaktionsmodell:

Erster Anruf. Die Ziele des Benutzers (d.h. die Benutzeraufforderungen) werden dem LLM vorgelegt.
Werkzeugaufruf. Stellt das Modell fehlende Informationen oder mehrdeutige Anweisungen fest, wählt es ein Tool oder eine Abfragemethode (z. B. eine Vektordatenbankabfrage (z. B. die hybride Suche von Azure AI Search nach privaten Daten) oder einen strukturierten SQL-Aufruf), um mehr Kontext zu erfassen.
Bewertung und Optimierung. Nach Prüfung der zurückgegebenen Daten entscheidet das Modell, ob die Informationen ausreichen. Ist dies nicht der Fall, optimiert es die Abfrage, probiert andere Tools aus oder passt seinen Ansatz an.
Wiederholen Sie den Vorgang, bis Sie zufrieden sind. Dieser Zyklus wird so lange fortgesetzt, bis das Modell feststellt, dass es genügend Klarheit und Beweise hat, um eine endgültige, gut begründete Antwort zu geben.
Speicher und Status. Da das System den Zustand und das Gedächtnis während der einzelnen Schritte beibehält, kann es frühere Versuche und deren Ergebnisse abrufen, so dass sich wiederholende Zyklen vermieden werden und im weiteren Verlauf fundiertere Entscheidungen getroffen werden können.

Im Laufe der Zeit entsteht so ein sich entwickelndes Verständnis, das es dem Modell ermöglicht, komplexe mehrstufige Aufgaben zu bewältigen, ohne dass ein ständiges menschliches Eingreifen oder eine Neugestaltung von Hinweisen erforderlich ist.

Umgang mit Fehlermöglichkeiten und Selbstkorrektur

Die Autonomie von Agentic RAG beinhaltet auch einen leistungsfähigen Selbstkorrekturmechanismus. Wenn das System in eine Sackgasse gerät (z.B. ein irrelevantes Dokument findet oder auf eine falsch formatierte Anfrage stößt), kann es:

Iteration und erneute Abfrage. Anstatt minderwertige Antworten zurückzugeben, probiert das Modell neue Suchstrategien aus, schreibt Datenbankabfragen um oder prüft alternative Datensätze.
Einsatz von Diagnoseinstrumenten. Das System kann zusätzliche Funktionen aufrufen, die ihm dabei helfen, seine Inferenzschritte zu debuggen oder die Korrektheit der abgerufenen Daten zu bestätigen. Tools wie Azure AI Tracing helfen dabei, eine robuste Beobachtbarkeit und Überwachung zu ermöglichen.
Abhängigkeit von der manuellen Überwachung. Bei hohem Risiko oder wiederholten Fehlern kann das Modell Unsicherheiten anzeigen und menschliche Anleitung anfordern. Sobald der Mensch eine korrigierende Rückmeldung gibt, kann das Modell diese Erfahrung in Zukunft übernehmen.

Dieser iterative und dynamische Ansatz ermöglicht eine kontinuierliche Verbesserung des Modells und stellt sicher, dass es sich nicht um ein einmaliges System handelt, sondern um eines, das aus Fehlern in einer bestimmten Sitzung lernen kann.

Die Grenzen des Agenten

Obwohl die agentenbasierte RAG in ihren Aufgaben autonom ist, ist sie nicht mit einer universellen KI gleichzusetzen. Seine "agenturischen" Fähigkeiten sind auf die von menschlichen Entwicklern bereitgestellten Werkzeuge, Datenquellen und Richtlinien beschränkt. Sie kann keine eigenen Werkzeuge erfinden oder über die Grenzen eines bestimmten Bereichs hinausgehen. Stattdessen zeichnet sie sich dadurch aus, dass sie die vorhandenen Ressourcen dynamisch orchestriert. Zu den wichtigsten Unterschieden zu fortgeschritteneren Formen der KI gehören:

Autonomie in bestimmten Bereichen. Agentenbasierte RAG-Systeme konzentrieren sich auf die Erreichung benutzerdefinierter Ziele innerhalb bekannter Domänen und verwenden Strategien wie das Umschreiben von Anfragen oder die Auswahl von Werkzeugen, um die Ergebnisse zu verbessern.
Abhängigkeiten von der Infrastruktur. Die Leistungsfähigkeit des Systems hängt von den Werkzeugen und Daten ab, die die Entwickler integrieren. Ohne menschliches Eingreifen kann es diese Grenzen nicht überschreiten.
Respekt vor der Leitplanke. Ethikkodex, Compliance-Regeln und Geschäftsstrategien bleiben wichtig. Die Freiheit des Agenten unterliegt (hoffentlich?) immer Sicherheitsmaßnahmen und Überwachungsmechanismen.

Praktische Anwendungsfälle und Nutzen

Agentic RAG glänzt in Szenarien, die eine iterative Optimierung und Präzision erfordern:

"Eine Umgebung, in der Korrektheit an erster Stelle steht. Bei der Überprüfung der Einhaltung von Vorschriften, bei der Analyse von Rechtsvorschriften oder bei juristischen Recherchen können Agentic-Modelle iterativ Fakten verifizieren, mehrere Quellen konsultieren und Abfragen umschreiben, bis eine gründlich geprüfte Antwort vorliegt.
Komplexe Datenbankinteraktionen. Bei der Arbeit mit strukturierten Daten, bei denen Abfragen häufig fehlschlagen oder angepasst werden müssen, können Systeme Azure SQL oder Microsoft Fabric OneLake verwenden, um ihre Abfragen autonom zu optimieren und sicherzustellen, dass die endgültige Abfrage der Absicht des Benutzers entspricht.
Erweiterter Workflow. Länger andauernde Sitzungen können sich ändern, wenn neue Informationen verfügbar werden, und Agentic RAG kann kontinuierlich neue Daten integrieren und Strategien ändern, wenn mehr über den Problemraum gelernt wird.

Governance, Transparenz und Vertrauen

Da diese Systeme in ihren Überlegungen immer autonomer werden, sind Governance und Transparenz von entscheidender Bedeutung:

Interpretierbare Argumentation. Tools wie Azure AI Content Safety und Azure AI Tracing / GenAIOps können dabei helfen, die Transparenz aufrechtzuerhalten und das Risiko zu mindern.
Kontrolle der Abweichung und Wiederherstellung des Gleichgewichts. Entwickler können Abrufstrategien anpassen, um sicherzustellen, dass ausgewogene, repräsentative Datenquellen berücksichtigt werden, und Azure Machine Learning verwenden, um Modelle für fortgeschrittene Data-Science-Organisationen anzupassen und die Ausgabe regelmäßig zu überprüfen, um Verzerrungen oder verzerrte Muster zu erkennen.
Manuelle Überwachung und Compliance. Bei sensiblen Aufgaben ist eine manuelle Überprüfung nach wie vor unabdingbar. agentic RAG ersetzt nicht die manuelle Beurteilung bei risikoreichen Entscheidungen, sondern ergänzt sie durch die Möglichkeit einer gründlicheren Überprüfung.

Es ist wichtig, über Werkzeuge zu verfügen, die eine klare Aufzeichnung der Vorgänge ermöglichen. Ohne sie kann die Fehlersuche in einem mehrstufigen Prozess sehr schwierig sein. Bei Literal AI (dem Unternehmen hinter Chainlit) finden Sie ein Beispiel für einen Agentenlauf:

zu einem Urteil gelangen

Die agentenbasierte RAG stellt eine natürliche Entwicklung in der Art und Weise dar, wie KI-Systeme komplexe, datenintensive Aufgaben angehen. Durch die Übernahme eines zyklischen Interaktionsmodells, die autonome Auswahl von Werkzeugen und die Optimierung von Abfragen, bis qualitativ hochwertige Ergebnisse erzielt werden, wandeln sich die Systeme von statischen, prompterfolgenden zu adaptiven, kontextbewussten Entscheidungsträgern. Diese agentenbasierten Fähigkeiten sind zwar immer noch an vom Menschen definierte Infrastrukturen und ethische Grundsätze gebunden, bieten aber reichhaltigere, dynamischere und letztlich nützlichere KI-Interaktionen für Unternehmen und Endnutzer.