AI Personal Learning
und praktische Anleitung

AI Engineering Academy: 2.2 Grundlegende RAG-Implementierung

(jemandem eine Stelle etc.) anbieten

 

Suche - Erweiterte Generierung (RAG) ist eine leistungsstarke Technik, die die Vorteile großer Sprachmodelle mit der Fähigkeit kombiniert, relevante Informationen aus einer Wissensbasis abzurufen. Dieser Ansatz verbessert die Qualität und Genauigkeit der generierten Antworten, indem er auf spezifischen abgerufenen Informationen basiert.a Dieses Notizbuch soll eine klare und prägnante Einführung in RAG bieten und ist für Anfänger geeignet, die diese Technik verstehen und implementieren möchten.

RAG-Prozess


 

Eröffnungsfeier

Notebook

Sie können das in diesem Repository enthaltene Notebook ausführen. https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/01_Basic_RAG

Chat-Anwendung

  1. Abhängigkeiten installieren:
    pip install -r anforderungen.txt
    
  2. Führen Sie die Anwendung aus:
    python app.py
    
  3. Dynamischer Import von Daten:
    python app.py --ingest --data_dir /path/to/documents
    

Server (Computer)

Verwenden Sie den folgenden Befehl, um den Server zu starten:

python server.py

Der Server bietet zwei Endpunkte:

  • /api/ingest
  • /api/abfrage

 

Lokomotive

Traditionelle Sprachmodelle generieren Text auf der Grundlage von Mustern, die aus Trainingsdaten gelernt wurden. RAG behebt diese Einschränkung durch die Einführung eines Retrieval-Schrittes, der das Sprachmodell mit relevantem Kontext versorgt, um genauere Antworten zu generieren.

 

Methodische Einzelheiten

Vorverarbeitung von Dokumenten und Erstellung von Vektorspeichern

  1. Chunking von DokumentenVorverarbeitung und Aufteilung von Dokumenten der Wissensdatenbank (z.B. PDFs, Artikel) in überschaubare Teile (Chunks). So entsteht ein durchsuchbarer Korpus für effiziente Suchprozesse.
  2. Einbettung generierenJeder Block wird in eine Vektordarstellung umgewandelt, wobei eine zuvor trainierte Einbettung (z. B. die Einbettung von OpenAI) verwendet wird. Diese Dokumente werden dann in einer Vektordatenbank (z. B. Qdrant) für eine effiziente Ähnlichkeitssuche gespeichert.

Retrieval Augmentation Generation (RAG) Arbeitsablauf

  1. Anfrage Eingabe:: Benutzer stellen Fragen, die beantwortet werden müssen.
  2. SuchschrittEinbettung der Abfrage als Vektor unter Verwendung des gleichen Einbettungsmodells wie die Dokumente. Dann wird eine Ähnlichkeitssuche in der Vektordatenbank durchgeführt, um den relevantesten Block von Dokumenten zu finden.
  3. Schritte zur Erzeugung:: Die abgerufenen Dokumentabschnitte werden als zusätzlicher Kontext an ein großes Sprachmodell (z. B. GPT-4) weitergegeben. Das Modell verwendet diesen Kontext, um genauere und relevantere Antworten zu generieren.

 

Hauptmerkmale der RAG

  1. kontextuelle RelevanzRAG-Modell: Durch die Generierung von Antworten auf der Grundlage der tatsächlich abgerufenen Informationen kann das RAG-Modell kontextbezogenere und genauere Antworten geben.
  2. SkalierbarkeitDer Abrufschritt kann erweitert werden, um große Wissensdatenbanken zu verarbeiten, so dass das Modell Inhalte aus riesigen Informationsmengen extrahieren kann.
  3. Flexibilität im AnwendungsfallRAG kann an eine Vielzahl von Anwendungsszenarien angepasst werden, einschließlich Fragen und Antworten, Erstellung von Zusammenfassungen, Empfehlungssysteme und mehr.
  4. Verbesserte Genauigkeit:: Die Kombination von Abruf und Generierung führt häufig zu genaueren Ergebnissen, insbesondere bei Abfragen, die spezifische oder kalte Informationen erfordern.

 

Vorteile dieser Methode

  1. Kombination der Vorteile von Abruf und ErzeugungRAG verbindet effektiv einen Retrieval-basierten Ansatz mit einem generativen Modell, um sowohl genaue Fakten zu finden als auch natürliche Sprache zu generieren.
  2. Verbesserte Behandlung von Long-Tail-AnfragenDie Methode eignet sich besonders gut für Abfragen, die spezifische und ungewöhnliche Informationen erfordern.
  3. Anpassung der BereicheAbrufmechanismen können auf bestimmte Bereiche abgestimmt werden, um sicherzustellen, dass die erzeugten Antworten auf den relevantesten und genauesten bereichsspezifischen Informationen beruhen.

 

ein Urteil fällen

Retrieval-Augmented Generation (RAG) ist eine innovative Verschmelzung von Retrieval- und Generierungstechnologien, die die Fähigkeiten eines Sprachmodells effektiv erweitert, indem sie die Ausgabe auf relevante externe Informationen stützt. Dieser Ansatz ist besonders wertvoll in Antwortszenarien, die genaue und kontextbezogene Antworten erfordern (z. B. Kundensupport, wissenschaftliche Forschung usw.). Im Zuge der Weiterentwicklung der KI zeichnet sich RAG durch sein Potenzial aus, zuverlässigere und kontextsensitivere KI-Systeme zu entwickeln.

 

Vorbedingungen

  • Bevorzugt Python 3.11
  • Jupyter Notebook oder JupyterLab
  • LLM-API-Schlüssel
    • Jeder LLM kann verwendet werden. In diesem Notebook verwenden wir OpenAI und GPT-4o-mini.

Mit diesen Schritten können Sie ein grundlegendes RAG-System implementieren, das reale, aktuelle Informationen einbezieht, um die Effizienz von Sprachmodellen in einer Vielzahl von Anwendungen zu verbessern.

AI Leichtes Lernen

Der Leitfaden für Laien zum Einstieg in die KI

Hilft Ihnen, die Nutzung von KI-Tools kostengünstig und von Null an zu erlernen.KI ist, wie Bürosoftware, eine wesentliche Fähigkeit für jeden. Die Beherrschung von KI verschafft Ihnen einen Vorteil bei der Stellensuche und die Hälfte des Aufwands bei Ihrer zukünftigen Arbeit und Ihrem Studium.

Details ansehen>
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " AI Engineering Academy: 2.2 Grundlegende RAG-Implementierung

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)