Instituto de Ingeniería de la IA: 2.9 Ventana de frases Generación aumentada de recuperación (RAG)

Base de conocimientos de IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

36.4K 00

introducción

El método Retrieval-Augmented Generation (RAG) basado en ventanas de frases es RAG Implementación de alto nivel de un marco diseñado para mejorar el conocimiento del contexto y la coherencia de las respuestas generadas por IA. El enfoque combina la potencia de grandes modelos lingüísticos con técnicas eficaces de recuperación de información para ofrecer una solución fiable que genere respuestas de alta calidad y ricas en contexto.

https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/04_Sentence_Window_RAG

locomotora

Los sistemas convencionales de RAG suelen tener dificultades para mantener la coherencia en contextos más amplios o no funcionan adecuadamente cuando tratan información que abarca varios bloques de texto. Los enfoques de generación basados en ventanas de frases mejoradas para la recuperación abordan esta limitación preservando las relaciones contextuales entre bloques de texto durante el proceso de indexación y utilizando esta información en los procesos de recuperación y generación.

Detalles metodológicos

Preprocesamiento de documentos y creación de almacenes vectoriales

División de documentos: Divide el documento de entrada en frases.
Creación de bloques de texto: Agrupa frases en trozos de texto manejables.
representación integradaCada bloque de texto se procesa a través de un modelo de incrustación para generar una representación vectorial.
Índice de la base de datos vectorialPermite almacenar los ID de los bloques de texto, el contenido del texto y los vectores de incrustación en una base de datos vectorial para una búsqueda eficaz de similitudes.
Índice de la estructura del documentoBase de datos: se utiliza una base de datos independiente para almacenar las relaciones entre bloques de texto, incluidas las referencias de cada bloque a los k bloques de texto anterior y posterior.

Flujo de trabajo de generación de mejoras de recuperación

procesamiento de consultasRepresentación incrustada de las consultas de los usuarios utilizando el mismo modelo de incrustación que para los bloques de texto.
Búsqueda por similitud: Utiliza vectores de incrustación de consulta para recuperar los bloques de texto más relevantes en la base de datos de vectores.
ampliación del contexto (informática)Para cada bloque de texto recuperado, se obtienen k bloques de texto anteriores y posteriores de la base de datos de la estructura del documento para la expansión del contexto.
combinación contextual: Combina el bloque de texto recuperado y su contexto ampliado con la consulta original.
Generar una respuestaPasar el contexto ampliado y la consulta al modelo de lenguaje grande para generar la respuesta final.

Características principales del GAR

Recuperación eficazRecuperación de información rápida y precisa mediante la búsqueda de similitudes vectoriales.
Reservas contextualesFunción de indexación: mantiene la relación entre la estructura del documento y los bloques de texto durante la fase de indexación.
Ventana contextual flexiblePermite cambiar el tamaño de la ventana de contexto durante la fase de recuperación.
escalabilidadCapacidad para gestionar grandes colecciones de documentos y diversos tipos de consulta.

Ventajas del método

Aumentar la coherenciaLa información contextual se ve reforzada por la introducción de bloques de texto circundantes, lo que da lugar a respuestas más coherentes y precisas desde el punto de vista contextual.
Reducción de las alucinacionesEl acceso al contexto ampliado permite al modelo generar respuestas basadas en la información recuperada, lo que reduce la probabilidad de generar contenidos falsos o irrelevantes.
Eficiencia de almacenamientoOptimiza el espacio de almacenamiento almacenando sólo la información necesaria en la base de datos vectorial.
Ventana contextual ajustable: Cambia dinámicamente el tamaño de la ventana contextual en función de las necesidades de las distintas consultas o aplicaciones.
Conservar la estructura del documento: Mantener la estructura y el flujo del documento original permite a la IA entender y generar el documento de forma más matizada.

resúmenes

La Generación Aumentada de Recuperación (GAR) basada en ventanas de frases ofrece una potente solución para mejorar la calidad y la relevancia contextual de las respuestas generadas por IA. Al preservar la estructura del documento y admitir ampliaciones flexibles del contexto, el planteamiento aborda eficazmente algunas de las principales limitaciones de los sistemas RAG tradicionales. Proporciona un marco fiable para construir sistemas avanzados de preguntas y respuestas, análisis de documentos y aplicaciones de generación de contenidos.