AI Engineering Academy: 2.12 Self-Query RAG: Verbesserte Retrieval Augmentation Generation mit Metadatenfilterung

AI-WissensdatenbankAktualisiert vor 8 Monaten AI-Austauschkreis

1.8K 00

(jemandem eine Stelle etc.) anbieten

Self-Query RAG (SQRAG) ist ein fortschrittlicher Ansatz für die Retrieval Augmentation Generation (RAG), der die traditionelle RAG durch die Extraktion von Metadaten in der Ingestion-Phase und intelligentes Query Parsing in der Retrieval-Phase erweitert. RAG Prozess.

https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/07_Self_Query_RAG

Lokomotive

Herkömmliche RAG-Systeme haben oft Schwierigkeiten, komplexe Abfragen zu bearbeiten, die semantische Ähnlichkeit und spezifische Metadatenbeschränkungen beinhalten. Die selbstabfragende RAG geht diese Herausforderungen an, indem sie Metadaten nutzt und Benutzeranfragen mithilfe des Large Language Model (LLM) intelligent analysiert.

Methodische Einzelheiten

Vorverarbeitung von Dokumenten und Erstellung von Vektorspeichern

Teilen Sie Dokumente in überschaubare Teile auf.
Extrahieren von Metadaten (z. B. Datum, Autor, Kategorie) aus jedem Chunk.
Betten Sie jedes Nugget mit dem entsprechenden Einbettungsmodell ein.
Indizieren Sie die Nuggets, ihre Einbettungsvektoren und die zugehörigen Metadaten in einer Vektordatenbank.

Selbstabfragender RAG-Workflow

Benutzer stellen Anfragen in natürlicher Sprache.
Parsing von Abfragen mit einem Large Language Model (LLM), um die Absicht des Benutzers und die Struktur der Abfrage zu verstehen.
LLM-Generation:
a) Abfragebasierte Filterbedingungen für Metadaten.
b) Semantische Suchanfragen für das inhaltsbezogene Retrieval.
Wenden Sie Metadatenfilter an, um Ihre Suche einzugrenzen.
Führt eine semantische Suche in einer gefilterten Teilmenge durch.
Die abgerufenen Dokumentenstücke werden mit der ursprünglichen Benutzeranfrage kombiniert, um einen Kontext zu bilden.
Übergeben Sie den Kontext an das Large Language Model (LLM), um die endgültige Antwort zu generieren.

Hauptmerkmale der selbstabfragenden RAG

Extraktion von MetadatenVerbessern Sie die Darstellung von Dokumenten mit strukturierten Informationen.
Intelligente AbfrageauflösungLLM verwenden, um komplexe Benutzeranfragen zu verstehen.
Hybridsuche: Kombination von Metadatenfilterung und semantischer Suche.
Flexible AnfrageErmöglicht Benutzern die implizite Angabe von Metadatenbeschränkungen in natürlicher Sprache.

Vorteile dieser Methode

Verbesserung der SuchgenauigkeitMetadatenfilter helfen, die Suche auf relevante Dokumente einzugrenzen.
Bearbeitung komplexer Abfragen: kann Abfragen interpretieren und beantworten, die Inhaltsähnlichkeit und Metadatenbeschränkungen beinhalten.
Effizienter AbrufMetadatenfilterung kann die Anzahl der Dokumente, die eine semantische Suche erfordern, erheblich reduzieren.
Erweiterter KontextMetadaten: Metadaten liefern zusätzliche strukturierte Informationen, die die Erstellung von Antworten verbessern.

zu einem Urteil gelangen

Self-Query RAG verbessert den traditionellen RAG-Prozess durch die Einführung von Metadatenextraktion und intelligentem Query Parsing. Dieser Ansatz macht die Abfrage genauer und effizienter, insbesondere bei komplexen Abfragen, die semantische Ähnlichkeit und spezifische Metadatenbeschränkungen beinhalten. Durch die Nutzung des Large Language Model (LLM) für das Verstehen von Abfragen bietet die selbstabfragende RAG KI-Q&A-Systemen genauere und kontextrelevante Antworten.