AI Personal Learning
und praktische Anleitung

PRAG: Parametric Retrieval Augmentation Generation Tool zur Verbesserung der Leistung von Q&A Systemen

Allgemeine Einführung

PRAG (Parametric Retrieval-Augmented Generation) ist ein innovatives Retrieval-Augmented Generation Tool, das die Generierung durch die Einbettung von externem Wissen direkt in den Parameterraum eines Large Language Model (LLM) verbessert. Das Tool überwindet die Beschränkungen traditioneller kontextbezogener Retrieval-Augmented Generation-Methoden, reduziert den Rechenaufwand und verbessert die Argumentations- und Synthesefähigkeiten des Modells durch die tiefgreifende Integration externen Wissens.PRAG bietet End-to-End-Implementierungen einschließlich eines Datenanreicherungsmoduls, eines Parameter-Trainingsmoduls und eines Inferenzmoduls für Leistungstests verschiedener Quiz-Datensätze.

PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems-1


 

Funktionsliste

  • Modul DatenanreicherungUmwandlung von Dokumenten in mit Daten angereicherte Datensätze.
  • Modul ParameterschulungTrainieren Sie zusätzliche LoRA-Parameter, um eine parametrisierte Darstellung des Dokuments zu erzeugen.
  • Inferenz-ModulZusammenführen von parametrisierten Darstellungen verwandter Dokumente und Einfügen in das LLM zur Inferenz.
  • Umgebung InstallationEnthält detaillierte Schritte zur Installation der Umgebung und Abhängigkeiten.
  • SelbstverbesserungUnterstützung der direkten Verwendung von vorverbesserten Datendateien oder selbstverarbeiteten Datenverbesserungen.
  • Vorbereitung der SucheHerunterladen und Aufbereiten von Wikipedia-Datensätzen für den Abruf.

 

Hilfe verwenden

Umgebung Installation

  1. Erstellen und aktivieren Sie eine virtuelle Umgebung:
   conda create -n prag python=3.10.4
conda prag aktivieren
  1. Installieren Sie die erforderlichen Abhängigkeiten:
   pip install torch==2.1.0
pip install -r requirements.txt
  1. Änderungen src/root_dir_path.py den Nagel auf den Kopf treffen ROOT_DIR ist die Adresse des Ordners, in dem das PRAG gespeichert ist.

Datenerweiterung

  1. Verwenden Sie vorbereitete Datendateien:
   tar -xzvf daten_aug.tar.gz
  1. Selbstverarbeitende Datenanreicherung:
    • Laden Sie den Wikipedia-Datensatz herunter: bash
      mkdir -p data/dpr
      wget -O data/dpr/psgs_w100.tsv.gz https://dl.fbaipublicfiles.com/dpr/wikipedia_split/psgs_w100.tsv.gz
    • beabsichtigen BM25 Zurückgeholt: bash
      # Die genauen Schritte entnehmen Sie bitte der Projektdokumentation.

parametrisches Training

  1. Erzeugen Sie eine parametrisierte Darstellung des Dokuments:
   # Die genauen Schritte entnehmen Sie bitte der Projektdokumentation.

Inferenz

  1. Parametrisierte Darstellungen verwandter Dokumente werden zusammengeführt und zur Inferenz in das LLM eingefügt:
   # Die genauen Schritte entnehmen Sie bitte der Projektdokumentation.
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " PRAG: Parametric Retrieval Augmentation Generation Tool zur Verbesserung der Leistung von Q&A Systemen

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)