AI Personal Learning
und praktische Anleitung

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Dieser Artikel wurde am 2025-01-19 14:53 aktualisiert, ein Teil des Inhalts ist zeitkritisch, falls er ungültig ist, bitte eine Nachricht hinterlassen!

Allgemeine Einführung

MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, durch heterogene Graphenindizierung und leichtgewichtiges topologiegestütztes Retrieval auch für kleine Modelle eine gute RAG-Leistung zu erzielen. Das vom Data Science Laboratory der Universität Hongkong (HKUDS) entwickelte Projekt konzentriert sich auf die Lösung des Problems der Leistungsverschlechterung, mit dem Small Language Models (SLMs) in bestehenden RAG-Frameworks konfrontiert sind. miniRAG reduziert die Abhängigkeit von komplexem semantischem Verständnis durch die Kombination von Textbrocken und benannten Entitäten in einer einzigen einheitlichen Struktur und nutzt Graphenstrukturen für eine effiziente Wissensentdeckung. Der Rahmen erreicht eine vergleichbare Leistung mit nur 251 TP3T Speicherplatz des Large Language Model (LLM) Ansatzes.

MiniRAG: Vereinfachtes Retrieval Enhanced Generation Framework mit Knowledge Graph Embedded Relevant Text Blocks-1


 

Funktionsliste

  • Heterogener Graph-Indizierungsmechanismus: Kombination von Textblöcken und benannten Entitäten, um die Abhängigkeit von komplexem semantischem Verständnis zu verringern.
  • Leichtgewichtiges topologiegestütztes Retrieval: effiziente Wissensentdeckung mit Hilfe von Graphenstrukturen.
  • Kompatibel mit kleinen Sprachmodellen: effiziente RAG-Leistung in ressourcenbeschränkten Szenarien.
  • Umfassender Benchmark-Datensatz: Der LiHua-World-Datensatz wird bereitgestellt, um die Leistung von leichtgewichtigen RAG-Systemen bei komplexen Abfragen zu bewerten.
  • Einfache Installation: unterstützt die Installation aus dem Quellcode und von PyPI.

 

Hilfe verwenden

Ablauf der Installation

Installation von der Quelle aus (empfohlen)

  1. Klonen des MiniRAG-Repositorys:
   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG
  1. Installieren Sie die Abhängigkeit:
   pip install -e .

Installation von PyPI

MiniRAG basiert auf LightRAG und kann daher direkt installiert werden:

pip install lightrag-hku

Schnellstart

  1. Laden Sie den gewünschten Datensatz herunter und platzieren Sie ihn im Ordner. /DatensatzKatalog. Zum Beispiel wurde der Datensatz LiHua-World in den. /datensatz/LiHua-World/data/Katalog.
  2. Verwenden Sie den folgenden Befehl, um das Dataset zu indizieren:
   python . /reproduce/Schritt_0_index.py
  1. Führen Sie das Q&A-Modul aus:
   python . /reproduce/Schritt_1_QA.py
  1. Alternativ können Sie auch die. /main.pyDer Code in initialisiert das MiniRAG.

Hauptfunktionen

Heterogener Graph-Indizierungsmechanismus

MiniRAG erstellt heterogene Graph-Indizes, indem es Textblöcke und benannte Entitäten in einer einheitlichen Struktur kombiniert. Die Benutzer können dies mit den folgenden Schritten erreichen:

  1. Bereiten Sie den Datensatz vor und stellen Sie sicher, dass der Datensatz wie gewünscht formatiert ist.
  2. Führen Sie das Indizierungsskript aus:
   python . /reproduce/Schritt_0_index.py
  1. Nach Abschluss der Indizierung werden die Daten in dem angegebenen Verzeichnis gespeichert und können später abgerufen werden.

Leichtgewichtige, topologieerweiterte Suche

MiniRAG nutzt die Graphenstruktur für eine effiziente Wissenssuche, die der Nutzer in den folgenden Schritten abrufen kann:

  1. Initialisieren Sie das MiniRAG:
   from minirag import MiniRAG
Modell = MiniRAG()
  1. Laden Sie den Datensatz und rufen Sie ihn ab:
   Ergebnisse = model.retrieve("Ihre Anfrage")
  1. Verarbeitet die Suchergebnisse und erzeugt eine Antwort:
   Antwort = model.generate(Ergebnisse)

Mit den oben genannten Schritten können die Benutzer die Funktionen von MiniRAG zur effizienten Generierung von Sucherweiterungen voll ausschöpfen.

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)