Recuperación: ¿Qué es la recuperación y explique las técnicas de "recuperación" más utilizadas en el GAR?

Base de conocimientos de IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

concepto básico

En el ámbito de las tecnologías de la información.Recuperación significa que a partir de un gran conjunto de datos (normalmente un documento, página web, imagen, audio, vídeo u otra forma de información), basándose en la consulta o necesidad de un usuario, elEl proceso de localizar y extraer eficazmente la información pertinente. Su principal objetivo es encontrarInformación más pertinente para las necesidades del usuarioy presentarlo al usuario.

ConsultaTérmino o condición de búsqueda introducido por el usuario.
ÍndiceEstructura de datos que preprocesa los datos para mejorar la eficacia de la recuperación.
Relevancia: Medida en que los resultados obtenidos coinciden con la consulta.

Los esquemas de GAR basados en la construcción de grandes bases de conocimiento de modelos no suelen utilizar una única técnica de "recuperación", por ejemplo, la comúnmente utilizada: recuperación híbrida dispersa + densa. La selección de la técnica de recuperación tiene que adaptarse cuidadosamente al contenido que se desea recuperar, lo que requiere mucha depuración.

$Retrieval：讲解RAG中常见的\$

El modelo principal de recuperación

Los modelos de recuperación se clasifican principalmente en: modelos booleanos, modelos de espacio vectorial, modelos probabilísticos, modelos de redes neuronales, modelos de grafos (por ejemplo, Knowledge Graph) y modelos lingüísticos (por ejemplo, GPT3).

Los principales modelos de recuperación pueden dividirse "simplemente" en dos categorías, cuya diferencia fundamental es cómo entienden y corresponden el texto:

1. Concordancia léxica/de palabras clave.

Este tipo de modelo se centra en consultas y documentos enPalabras literalmente igualessin una comprensión más profunda del significado de las palabras.

Idea central. Cuente las apariciones de palabras en documentos y consultas y emparéjelas.
Modelos principales.
- Modelo booleano. Coincidencia simple basada en la presencia o ausencia de la palabra clave (AND, OR, NOT).
- Modelo de espacio vectorial (VSM). Los documentos y las consultas se representan como vectores de pesos de palabras, que se emparejan por similitud vectorial (por ejemplo, similitud coseno). Un método de ponderación habitual es el TF-IDF.
- BM25. Un modelo mejorado basado en estadísticas probabilísticas que tiene en cuenta factores como la longitud del documento es la piedra angular de muchos motores de búsqueda.

Pros. Sencillo, eficaz y fácil de aplicar.
Desventajas. Incapacidad para comprender las relaciones semánticas de las palabras y susceptibilidad a problemas como los sinónimos y la polisemia.

2. Correspondencia semántica y de significado.

Los modelos de incrustación basados en la semántica, además de admitir distintas longitudes y dimensiones de texto incrustado, también tienen distintas formas de entender las "frases", lo que constituye una prioridad en la selección de modelos de incrustación (aunque la mayoría de ellos utilizan modelos más generales).
Por ejemplo, algunos modelos prefieren semánticamente la palabra "manzana" a "fruta" y otros a "teléfono móvil".

Este tipo de modelo intenta comprender la consulta y el documentoinformación semántica profundano sólo una coincidencia superficial de palabras.

Idea central. Asignación de texto al espacio semántico y correspondencia por similitud semántica.
Modelos principales.
- Modelos temáticos. Minería de documentos en busca de temas potenciales, recuperados por similitud temática (por ejemplo, LDA).
- Modelos de incrustación. El mapeo de palabras, frases o documentos en un espacio vectorial denso de baja dimensión captura la información semántica.
  - Incrustación de palabras. Algunos ejemplos son Word2Vec, GloVe, FastText.
  - Incrustación de frases. Por ejemplo, Sentencia-BERT. Universal Codificador de frases. Incrustaciones de OpenAI.
- Modelos densos de recuperación. Las consultas y los documentos se codifican en vectores densos de alta dimensión utilizando modelos de aprendizaje profundo (normalmente Transformer) y se recuperan por similitud vectorial. Algunos ejemplos son DPR, Contriever y el Incrustaciones de OpenAI El sistema de recuperación construido.
- Modelos de interacción neuronal. Modelización más precisa de las interacciones entre consultas y documentos, por ejemplo, ColBERT, RocketQA.
- Modelos de redes neuronales gráficas. Los documentos y las consultas se construyen en forma de grafos y se recuperan utilizando la estructura del grafo.

Pros. La capacidad de comprender mejor el significado de un texto, tratar las correlaciones semánticas y encontrar información relevante con mayor precisión.
Desventajas. Suelen ser más complejos y costosos desde el punto de vista informático.

Diferencia clave:

Los modelos de concordancia léxica parecen "literales"centrándose en las palabras clave.
Los modelos de correspondencia semántica se fijan en el "significado"El enfoque se centra en los significados intrínsecos y las relaciones del texto.

Cuadro sinóptico:

categorización	idea central	Modelos principales	RAG Aplicación centrada en
Correspondencia basada en el vocabulario	Palabras literalmente iguales	Modelos booleanos, modelos de espacio vectorial (VSM), BM25	Escenarios tempranos o simples
Correspondencia semántica	Comprender la información semántica profunda	Modelos temáticos, modelos de inserción de palabras, modelos de inserción de frases (con Incrustaciones de OpenAI), los modelos de búsqueda densa (incluidos los basados en Incrustaciones de OpenAI sistemas), modelos de interacción de redes neuronales, modelos de redes neuronales gráficas	Selección principal, con especial atención a la incrustación de frases y la búsqueda intensiva

Aplicaciones en el GAR

RAG (Recuperación-Generación Aumentada)es un marco de IA que combina técnicas de recuperación y generación cuyo uso principal es mejorar la precisión y la relevancia contextual de los contenidos generados.

fase de recuperaciónIdentificar documentos o pasajes de una gran base de conocimientos que sean pertinentes para la entrada del usuario.
fase de generación: Utiliza la información recuperada como contexto para generar respuestas o contenidos.

En RAG, el modelo de recuperación se encarga de proporcionar fuentes de información de alta calidad, mientras que el modelo generativo se encarga de generar respuestas en lenguaje natural basadas en esta información. Dado que RAG puede obtener información actualizada de fuentes de conocimiento externas, su rendimiento es especialmente bueno a la hora de responder a preguntas con un uso intensivo de conocimientos.

Enfoque de la aplicación en RAG:

En RAG (Retrieval Augmentation Generation).A menudo se prefieren los modelos de correspondencia semánticaporque pueden recuperar con mayor precisión información contextual relevante para la consulta del usuario, ayudando así al modelo generativo a producir respuestas más precisas y coherentes. En concreto.Modelos de incrustación de frases y modelos densos de recuperaciónPor ejemplo, basándose en Incrustaciones de OpenAI de recuperación, que se utiliza ampliamente en los sistemas RAG debido a su excelente capacidad de representación semántica y eficacia de recuperación.

caso (derecho)

1. Aplicación de la recuperación léxica (Lexical Retrieval)

Ideas centrales: El sistema de recuperación se basa en gran medida en consultas y documentos enConcordancia literal de palabras clave.
Caso 1: Encontrar una orden específica en la documentación técnica
- Escena: Estás utilizando un programa informático y quieres saber cómo realizar una operación de copia de archivos y necesitas encontrar el comando correspondiente.
- Mecanismo de recuperación: El sistema RAG utiliza un modelo basado en vocabulario (por ejemplo, BM25) para buscar en la documentación de ayuda del software pasajes que contengan las palabras clave "copiar archivo", "comando de copia de archivo" o "copiar archivo".
- Ejemplo de resultados de búsqueda: El sistema puede encontrar una sección del documento titulada "Comandos de gestión de archivos" que contiene la sección "Uso de la función cp A continuación se describe el comando "Comando para copiar archivo".
- Cómo ayudar a generar: Las instrucciones específicas para los comandos de contención recuperados se proporcionan al modelo de generación, que puede generar pasos de acción más precisos, por ejemplo cp para copiar un archivo. Por ejemplo.cp fuente.txt destino.txt copiará fuente.txt a destino.txt".
- Puntos clave: La recuperación se basa en la coincidencia exacta de palabras clave. Si utiliza una frase diferente, como "traslado de copias de documentos", es posible que no obtenga los mismos resultados.
Caso 2: Buscar un modelo concreto en un catálogo
- Escena: Desea adquirir un modelo concreto de impresora, por ejemplo, "Modelo XYZ-123".
- Mecanismo de recuperación: El sistema RAG busca en la base de datos del catálogo entradas que contengan el nombre exacto del modelo "XYZ-123".
- Ejemplo de resultados de búsqueda: El sistema encontrará entradas de producto con el nombre, especificaciones detalladas, precio y otra información sobre "Impresora XYZ-123".
- Cómo ayudar a generar: La información recuperada sobre el producto puede utilizarse directamente para generar presentaciones, consultas de precios o enlaces de compra, etc., sobre el modelo de impresora.
- Puntos clave: Se basa en la correspondencia exacta de los modelos de producto. Si el usuario introduce una descripción vaga, como "impresora de alto rendimiento", una búsqueda basada en términos puede no funcionar bien.

2. Aplicaciones de la recuperación semántica

Ideas centrales: El sistema de recuperación entiende la consulta y el documentoinformación semántica profundaAsí, podrá encontrar contenido relevante aunque no tenga exactamente las mismas palabras clave.
Caso 3: Encontrar información sobre los síntomas de una enfermedad en la literatura médica
- Escena: Quieres saber "Cuáles son las molestias habituales causadas por la hipertensión arterial"?
- Mecanismo de recuperación: El sistema RAG utiliza un modelo basado en la semántica (por ejemplo, búsqueda densa basada en Sentence-BERT u OpenAI Embeddings) para vectorizar la consulta y la literatura médica, y luego encuentra el pasaje más cercano al vector de consulta en el espacio semántico. Incluso si los documentos no contienen exactamente la misma redacción, por ejemplo, utilizando "presión arterial elevada" en lugar de "hipertensión" o descripciones de síntomas específicos en lugar de "malestar", pueden recuperarse. buscarse.
- Ejemplo de resultados de búsqueda: El sistema puede encontrar pasajes que contengan el siguiente texto: "Las personas con hipertensión arterial suelen manifestar síntomas como dolores de cabeza, mareos y opresión en el pecho. Una hipertensión prolongada e incontrolada puede provocar palpitaciones y dificultad para respirar."
- Cómo ayudar a generar: Las descripciones recuperadas de los síntomas de la hipertensión se proporcionan al modelo generativo, que puede producir una respuesta más natural y completa: "La hipertensión puede causar una amplia gama de molestias, entre las que se incluyen habitualmente dolor de cabeza, mareos y opresión en el pecho. La hipertensión grave o prolongada también puede causar palpitaciones y dificultad para respirar."
- Puntos clave: Ser capaz de comprender sinónimos ("tensión arterial elevada" frente a "tensión arterial alta"), expresiones próximas ("malestar físico" frente a "dolor de cabeza, mareos ") y conceptos relacionados que proporcionan un contexto más rico.
Caso 4: Encontrar estilos de texto similares en la ayuda a la escritura creativa
- Escena: Estás trabajando en una novela de ciencia ficción y quieres encontrar algunos pasajes de un estilo literario similar para utilizarlos como inspiración. Escribes: "Describe una visión próspera de una ciudad futura, llena de edificios altísimos y tráfico intenso".
- Mecanismo de recuperación: El sistema RAG utiliza un modelo basado en la semántica para buscar en una gran biblioteca de textos de ciencia ficción los pasajes que más se aproximan semánticamente a su descripción, aunque no utilicen exactamente palabras clave como "ciudad del futuro" o "boom".
- Ejemplo de resultados de búsqueda: El sistema podría encontrar pasajes como: "Gigantes de acero atravesaban las nubes y las paredes de cristal reflejaban una luz de colores. Los coches voladores se desplazaban como lanzaderas entre los edificios, las multitudes bullían en el suelo y el zumbido de la energía llenaba la ciudad que nunca duerme".
- Cómo ayudar a generar: Los pasajes recuperados con estados de ánimo y descripciones similares pueden servir de referencia al modelo generativo, ayudándole a crear un texto más acorde con el estilo deseado.
- Puntos clave: Ser capaz de comprender el significado implícito, el colorido emocional y el estilo del texto va más allá de la simple concordancia de palabras clave y se centra más en las similitudes semánticas.