MiniRAG : Cadre de génération amélioré pour la recherche simplifiée, index de graphe d'entité rappelant les blocs de texte pertinents.

Dernières ressources sur l'IAMise à jour il y a 8 mois Cercle de partage de l'IA

19.4K 00

Introduction générale

MiniRAG est un cadre extrêmement simple de Génération Augmentée de Récupération (RAG) qui vise à atteindre de bonnes performances RAG même pour les petits modèles grâce à l'indexation de graphes hétérogènes et à la récupération topologique légère. Développé par le Data Science Laboratory de l'Université de Hong Kong (HKUDS), le projet se concentre sur la résolution du problème de dégradation des performances auquel sont confrontés les petits modèles linguistiques (SLM) dans les cadres RAG existants. miniRAG réduit la dépendance à l'égard d'une compréhension sémantique complexe en combinant les morceaux de texte et les entités nommées dans une structure unifiée unique, et exploite les structures de graphe pour une découverte efficace des connaissances. Le cadre atteint des performances comparables avec seulement 251 TP3T de l'espace de stockage de l'approche du grand modèle de langage (LLM).

Liste des fonctions

Mécanisme d'indexation de graphes hétérogènes : combinaison de blocs de texte et d'entités nommées pour réduire la dépendance à l'égard d'une compréhension sémantique complexe.
Recherche topologique légère : découverte efficace de connaissances à l'aide de structures graphiques.
Compatibilité avec les modèles linguistiques de petite taille : performance efficace du RAG dans les scénarios à ressources limitées.
Ensemble de données de référence complet : l'ensemble de données LiHua-World est fourni pour évaluer les performances des systèmes RAG légers dans le cadre de requêtes complexes.
Installation facile : permet l'installation à partir du code source et de PyPI.

Utiliser l'aide

Processus d'installation

Installation à partir de la source (recommandée)

Clonage du dépôt MiniRAG :

   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG

Installer la dépendance :

   pip install -e .

Installation à partir de PyPI

MiniRAG est basé sur LightRAG et peut donc être installé directement :

pip install lightrag-hku

Démarrage rapide

Téléchargez l'ensemble de données requis et placez-le dans le fichier./datasetcatalogue. Par exemple, l'ensemble de données LiHua-World a été placé dans la section./dataset/LiHua-World/data/Catalogue.
Utilisez la commande suivante pour indexer le jeu de données :

   python ./reproduce/Step_0_index.py

Lancer le module Q&R :

   python ./reproduce/Step_1_QA.py

Il est également possible d'utiliser l'option./main.pyLe code suivant initialise le MiniRAG.

Principales fonctions

Mécanisme d'indexation hétérogène des graphes

MiniRAG crée des index de graphes hétérogènes en combinant des blocs de texte et des entités nommées dans une structure unifiée. Les utilisateurs peuvent y parvenir en suivant les étapes ci-dessous :

Préparer le jeu de données et s'assurer qu'il est formaté comme il se doit.
Exécuter le script d'indexation :

   python ./reproduce/Step_0_index.py

Une fois l'indexation terminée, les données sont stockées dans le répertoire spécifié pour être récupérées ultérieurement.

Recherche améliorée par topologie légère

MiniRAG utilise des structures graphiques pour une découverte efficace des connaissances, qui peuvent être récupérées par l'utilisateur au cours des étapes suivantes :

Initialiser le MiniRAG :

   from minirag import MiniRAG
model = MiniRAG()

Charger l'ensemble de données et le récupérer :

   results = model.retrieve("你的查询")

Traite les résultats de la recherche et génère une réponse :

   response = model.generate(results)

Grâce aux étapes ci-dessus, les utilisateurs peuvent tirer pleinement parti des fonctionnalités de MiniRAG pour générer des améliorations de recherche efficaces.

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Wanxing Zhi Acting : présentation vidéo générée par l'IA, explication du document PPT en ligne

Dernières ressources sur l'IA # Présentation générée par l'IA/PPT

il y a 1 an

017.9K

NovaCV - AI CV Generator Tool, Créer un CV professionnel pour la recherche d'emploi en un seul clic

Dernières ressources sur l'IA

Il y a 3 mois

017K

Melty : Découvrez un éditeur de code alimenté par l'IA, faites de chaque conversation un commit Git !

Dernières ressources sur l'IA # AI Java Open Source Projecct # Programmation AI

Il y a 9 mois

019.1K

Flux Gym : interface utilisateur simple pour l'entraînement FLUX LoRA avec une faible mémoire graphique

Dernières ressources sur l'IA # AI Aides à la génération d'images # AI Java Open Source Projecct

Il y a 10 mois

028K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

MiniRAG : Cadre de génération amélioré pour la recherche simplifiée, index de graphe d'entité rappelant les blocs de texte pertinents.

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Installation à partir de la source (recommandée)

Installation à partir de PyPI

Démarrage rapide

Principales fonctions

Mécanisme d'indexation hétérogène des graphes

Recherche améliorée par topologie légère

Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel

Charla : un outil de chat minimaliste basé sur des points d'accès avec une intégration native au backend d'Ollama.

Articles connexes

Wanxing Zhi Acting : présentation vidéo générée par l'IA, explication du document PPT en ligne

NovaCV - AI CV Generator Tool, Créer un CV professionnel pour la recherche d'emploi en un seul clic

Melty : Découvrez un éditeur de code alimenté par l'IA, faites de chaque conversation un commit Git !

Flux Gym : interface utilisateur simple pour l'entraînement FLUX LoRA avec une faible mémoire graphique

Pas de commentaires

Dernières collections

Derniers articles

MiniRAG : Cadre de génération amélioré pour la recherche simplifiée, index de graphe d'entité rappelant les blocs de texte pertinents.

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Installation à partir de la source (recommandée)

Installation à partir de PyPI

Démarrage rapide

Principales fonctions

Mécanisme d'indexation hétérogène des graphes

Recherche améliorée par topologie légère

Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel

Charla : un outil de chat minimaliste basé sur des points d'accès avec une intégration native au backend d'Ollama.

Articles connexes

Wanxing Zhi Acting : présentation vidéo générée par l'IA, explication du document PPT en ligne

NovaCV - AI CV Generator Tool, Créer un CV professionnel pour la recherche d'emploi en un seul clic

Melty : Découvrez un éditeur de code alimenté par l'IA, faites de chaque conversation un commit Git !

Flux Gym : interface utilisateur simple pour l'entraînement FLUX LoRA avec une faible mémoire graphique

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles