MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Neueste AI-RessourcenAktualisiert vor 8 Monaten AI-Austauschkreis

19.6K 00

Allgemeine Einführung

MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, durch heterogene Graphenindizierung und leichtgewichtiges topologiegestütztes Retrieval auch für kleine Modelle eine gute RAG-Leistung zu erzielen. Das vom Data Science Laboratory der Universität Hongkong (HKUDS) entwickelte Projekt konzentriert sich auf die Lösung des Problems der Leistungsverschlechterung, mit dem Small Language Models (SLMs) in bestehenden RAG-Frameworks konfrontiert sind. miniRAG reduziert die Abhängigkeit von komplexem semantischem Verständnis durch die Kombination von Textbrocken und benannten Entitäten in einer einzigen einheitlichen Struktur und nutzt Graphenstrukturen für eine effiziente Wissensentdeckung. Der Rahmen erreicht eine vergleichbare Leistung mit nur 251 TP3T Speicherplatz des Large Language Model (LLM) Ansatzes.

Funktionsliste

Heterogener Graph-Indizierungsmechanismus: Kombination von Textblöcken und benannten Entitäten zur Verringerung der Abhängigkeit von komplexem semantischem Verständnis.
Leichtgewichtiges topologiegestütztes Retrieval: effiziente Wissensentdeckung mit Hilfe von Graphenstrukturen.
Kompatibel mit kleinen Sprachmodellen: effiziente RAG-Leistung in ressourcenbeschränkten Szenarien.
Umfassender Benchmark-Datensatz: Der LiHua-World-Datensatz wird bereitgestellt, um die Leistung von leichtgewichtigen RAG-Systemen bei komplexen Abfragen zu bewerten.
Einfache Installation: unterstützt die Installation aus dem Quellcode und von PyPI.

Hilfe verwenden

Einbauverfahren

Installation von der Quelle aus (empfohlen)

Klonen des MiniRAG-Repositorys:

   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG

Installieren Sie die Abhängigkeit:

   pip install -e .

Installation von PyPI

MiniRAG basiert auf LightRAG und kann daher direkt installiert werden:

pip install lightrag-hku

Schnellstart

Laden Sie den gewünschten Datensatz herunter und platzieren Sie ihn im Ordner./datasetKatalog. Zum Beispiel wurde der Datensatz LiHua-World in den./dataset/LiHua-World/data/Katalog.
Verwenden Sie den folgenden Befehl, um das Dataset zu indizieren:

   python ./reproduce/Step_0_index.py

Führen Sie das Q&A-Modul aus:

   python ./reproduce/Step_1_QA.py

Alternativ können Sie auch die./main.pyDer Code in initialisiert das MiniRAG.

Hauptfunktionen

Heterogener Indexierungsmechanismus für Karten

MiniRAG erstellt heterogene Graph-Indizes, indem es Textblöcke und benannte Entitäten in einer einheitlichen Struktur kombiniert. Die Benutzer können dies mit den folgenden Schritten erreichen:

Bereiten Sie den Datensatz vor und stellen Sie sicher, dass der Datensatz wie gewünscht formatiert ist.
Führen Sie das Indizierungsskript aus:

   python ./reproduce/Step_0_index.py

Nach Abschluss der Indizierung werden die Daten in dem angegebenen Verzeichnis gespeichert und können später abgerufen werden.

Leichtgewichtige, topologieerweiterte Suche

MiniRAG nutzt Graphenstrukturen zur effizienten Wissensentdeckung, die in den folgenden Schritten vom Benutzer abgerufen werden können:

Initialisieren Sie das MiniRAG:

   from minirag import MiniRAG
model = MiniRAG()

Laden Sie den Datensatz und rufen Sie ihn ab:

   results = model.retrieve("你的查询")

Verarbeitet die Suchergebnisse und erzeugt eine Antwort:

   response = model.generate(results)

Mit den oben genannten Schritten können die Benutzer die Funktionen von MiniRAG zur effizienten Generierung von Sucherweiterungen voll ausschöpfen.

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Forage Mail: Intelligente Filterung minderwertiger E-Mails und Generierung von täglichen Mail Digests

Neueste AI-Ressourcen # AI Life Efficiency Assistant

vor 7 Monaten

017.4K

Murf AI: Sprachwandler|Sprache zu Text|Text zu Sprache|Audio Editor

Neueste AI-Ressourcen # AI Text-to-Speech # AI Sprachausgabe in Text

vor 12 Monaten

020.7K

LanPaint: Ein ComfyUI Bildwiederherstellungs-Workflow für jedes Modell

Neueste AI-Ressourcen # AI Bildvergrößerung und -wiederherstellung # ComfyUI

vor 6 Monaten

020K

Smooth Reading: Browser-Übersetzungs-Plug-in für reibungslose Web-Übersetzungen

Neueste AI-Ressourcen # AI Übersetzung # Browser AI-Assistent

vor 5 Monaten

017.2K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Installation von der Quelle aus (empfohlen)

Installation von PyPI

Schnellstart

Hauptfunktionen

Heterogener Indexierungsmechanismus für Karten

Leichtgewichtige, topologieerweiterte Suche

Omni-RGPT: Ein multimodales Grand-Modell für das Verständnis von Bild- und Videoregionen zur Verbesserung der Analyse visueller Inhalte

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration in das Ollama-Backend

Ähnliche Artikel

Forage Mail: Intelligente Filterung minderwertiger E-Mails und Generierung von täglichen Mail Digests

Murf AI: Sprachwandler|Sprache zu Text|Text zu Sprache|Audio Editor

LanPaint: Ein ComfyUI Bildwiederherstellungs-Workflow für jedes Modell

Smooth Reading: Browser-Übersetzungs-Plug-in für reibungslose Web-Übersetzungen

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Installation von der Quelle aus (empfohlen)

Installation von PyPI

Schnellstart

Hauptfunktionen

Heterogener Indexierungsmechanismus für Karten

Leichtgewichtige, topologieerweiterte Suche

Omni-RGPT: Ein multimodales Grand-Modell für das Verständnis von Bild- und Videoregionen zur Verbesserung der Analyse visueller Inhalte

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration in das Ollama-Backend

Ähnliche Artikel

Forage Mail: Intelligente Filterung minderwertiger E-Mails und Generierung von täglichen Mail Digests

Murf AI: Sprachwandler|Sprache zu Text|Text zu Sprache|Audio Editor

LanPaint: Ein ComfyUI Bildwiederherstellungs-Workflow für jedes Modell

Smooth Reading: Browser-Übersetzungs-Plug-in für reibungslose Web-Übersetzungen

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel