Institut d'ingénierie de l'IA : 2.9 Sentence Window Retrieval Augmented Generation (RAG)

Base de connaissances sur l'IAMise à jour il y a 9 mois Cercle de partage de l'IA

7.2K 00

introductif

La méthode RAG (Retrieval-Augmented Generation), basée sur des fenêtres de phrases, est la suivante RAG Une implémentation de haut niveau d'un cadre conçu pour améliorer la prise en compte du contexte et la cohérence des réponses générées par l'IA. L'approche combine la puissance de grands modèles de langage avec des techniques efficaces de recherche d'informations afin de fournir une solution fiable pour générer des réponses de haute qualité et riches en contexte.

https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/04_Sentence_Window_RAG

locomotive

Les systèmes conventionnels de RAG ont souvent du mal à maintenir la cohérence dans des contextes plus larges ou ne sont pas assez performants lorsqu'ils traitent des informations qui s'étendent sur plusieurs blocs de texte. Les approches de génération améliorée par récupération basée sur des fenêtres de phrases remédient à cette limitation en préservant les relations contextuelles entre les blocs de texte au cours du processus d'indexation et en utilisant ces informations dans le processus de récupération et de génération.

Détails méthodologiques

Prétraitement des documents et création d'une base de données vectorielles

Fractionnement de documents: Découper le document d'entrée en phrases.
Création de blocs de texteLes phrases sont regroupées en morceaux de texte faciles à gérer.
représentation intégréeChaque bloc de texte est traité par un modèle d'intégration afin de générer une représentation vectorielle.
Index de la base de données vectorielle: stocke les identifiants des blocs de texte, le contenu du texte et les vecteurs d'intégration dans une base de données vectorielle pour une recherche de similarité efficace.
Index de la structure du documentUne base de données distincte est utilisée pour stocker les relations entre les blocs de texte, y compris les références de chaque bloc aux k blocs précédents et suivants.

Flux de travail pour l'amélioration de la recherche

traitement des requêtesReprésentation intégrée des requêtes de l'utilisateur à l'aide du même modèle d'intégration que pour les blocs de texte.
Recherche de similitudeLes vecteurs d'intégration des requêtes permettent d'extraire les blocs de texte les plus pertinents de la base de données vectorielles.
extension du contexte (informatique)Pour chaque bloc de texte extrait, k blocs de texte antérieurs et postérieurs sont obtenus à partir de la base de données de la structure du document pour l'expansion du contexte.
combinaison contextuelleLa recherche de texte : Combiner le bloc de texte récupéré et son contexte élargi avec la requête originale.
Générer une réponseLe contexte étendu et la requête sont transmis au grand modèle linguistique afin de générer la réponse finale.

Caractéristiques principales du RAG

Recherche efficace: Recherche rapide et précise d'informations par le biais de la recherche de similarités vectorielles.
Réserves contextuellesLe système d'indexation : il maintient la relation entre la structure du document et les blocs de texte au cours de la phase d'indexation.
Fenêtre contextuelle flexiblePermet de redimensionner la fenêtre de contexte pendant la phase de recherche.
évolutivitéIl peut traiter de grandes collections de documents ainsi que divers types de requêtes.

Avantages de la méthode

Renforcer la cohérenceLes informations contextuelles sont renforcées par l'introduction de blocs de texte environnants, ce qui permet d'obtenir des réponses plus cohérentes et plus précises sur le plan contextuel.
Réduction des hallucinationsEn accédant au contexte élargi, le modèle est en mesure de générer des réponses basées sur les informations extraites, réduisant ainsi la probabilité de générer un contenu faux ou non pertinent.
Efficacité du stockageOptimiser l'espace de stockage en ne stockant que les informations nécessaires dans la base de données vectorielle.
Fenêtre contextuelle réglableLa fenêtre contextuelle : redimensionner dynamiquement la fenêtre contextuelle en fonction des besoins des différentes requêtes ou applications.
Conserver la structure du documentLe maintien de la structure et du flux du document original permet à l'IA de comprendre et de générer le document d'une manière plus nuancée.

résumés

L'approche RAG (Retrieval Augmented Generation) basée sur les fenêtres de phrases fournit une solution puissante pour améliorer la qualité et la pertinence contextuelle des réponses générées par l'IA. En préservant la structure du document et en prenant en charge des extensions contextuelles flexibles, l'approche répond efficacement à certaines des principales limitations des systèmes RAG traditionnels. Elle fournit un cadre fiable pour la construction de systèmes avancés de questions-réponses, d'analyse de documents et d'applications de génération de contenu.