AI Engineering Academy: 2.2 Implementación básica del GAR

Base de conocimientos de IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

40.5K 00

presentar (a algn. para un trabajo, etc.)

Buscar generación mejorada (RAG) es una potente técnica que combina las ventajas de los grandes modelos lingüísticos con la capacidad de recuperar información relevante de una base de conocimientos. Este enfoque mejora la calidad y la precisión de las respuestas generadas al basarlas en información específica recuperada.a Este cuaderno pretende ofrecer una introducción clara y concisa a la RAG y es adecuado para principiantes que deseen comprender e implementar esta técnica.

Proceso GAR

inauguración

Cuaderno

Puede ejecutar el cuaderno de notas proporcionado en este repositorio. https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/01_Basic_RAG

aplicación de chat

Instalar dependencias:
```
pip install -r requirements.txt
```
Ejecuta la aplicación:
```
python app.py
```

Importación dinámica de datos:

python app.py --ingest --data_dir /path/to/documents

servidor (ordenador)

Utilice el siguiente comando para ejecutar el servidor:

python server.py

El servidor proporciona dos puntos finales:

/api/ingest
/api/query

locomotora

Los modelos lingüísticos tradicionales generan texto basándose en patrones aprendidos a partir de datos de entrenamiento. Sin embargo, pueden tener dificultades para ofrecer respuestas precisas cuando se enfrentan a consultas que requieren información específica, actualizada o especializada. RAG aborda esta limitación introduciendo un paso de recuperación que proporciona al modelo lingüístico el contexto pertinente para generar respuestas más precisas.

Detalles metodológicos

Preprocesamiento de documentos y creación de almacenes vectoriales

Agrupación de documentosPreprocesamiento y división de documentos de bases de conocimiento (por ejemplo, PDF o artículos) en fragmentos manejables. De este modo se crea un corpus en el que se pueden realizar búsquedas para procesos de recuperación eficientes.
Generar incrustaciónCada bloque se convierte en una representación vectorial utilizando una incrustación previamente entrenada (por ejemplo, la incrustación de OpenAI). A continuación, estos documentos se almacenan en una base de datos vectorial (por ejemplo, Qdrant) para realizar búsquedas de similitud eficientes.

Flujo de trabajo de generación de aumento de la recuperación (RAG)

Entrada de consultas:: Los usuarios plantean preguntas que necesitan respuesta.
paso de búsquedaIncrusta la consulta como un vector utilizando el mismo modelo de incrustación que los documentos. A continuación, realiza una búsqueda de similitudes en la base de datos vectorial para encontrar el bloque de documentos más relevante.
Pasos de la generaciónEl modelo: los fragmentos de documentos recuperados se pasan como contexto adicional a un gran modelo lingüístico (por ejemplo, GPT-4). El modelo utiliza este contexto para generar respuestas más precisas y pertinentes.

Características principales del GAR

relevancia contextualEl modelo RAG: al generar respuestas basadas en la información real recuperada, el modelo RAG puede generar respuestas más pertinentes y precisas desde el punto de vista contextual.
escalabilidadLa etapa de recuperación puede ampliarse para manejar grandes bases de conocimiento, lo que permite al modelo extraer contenidos de cantidades masivas de información.
Flexibilidad de los casos de usoRAG puede adaptarse a una gran variedad de aplicaciones, como preguntas y respuestas, generación de resúmenes, sistemas de recomendación, etc.
Mayor precisiónLa combinación de recuperación y generación suele producir resultados más precisos, sobre todo en el caso de consultas que requieren información específica o fría.

Ventajas de este método

Combinar las ventajas de la recuperación y la generaciónRAG combina eficazmente un enfoque basado en la recuperación con un modelo generativo para la búsqueda precisa de datos y la generación de lenguaje natural.
Mejor gestión de las consultas de cola largaEl método funciona especialmente bien para consultas que requieren información específica y poco común.
Adaptación del dominioLos mecanismos de recuperación pueden adaptarse a ámbitos específicos para garantizar que las respuestas generadas se basen en la información más pertinente y precisa de cada ámbito.

llegar a un veredicto

La generación mejorada por recuperación (RAG, Retrieval-Augmented Generation) es una innovadora fusión de las tecnologías de recuperación y generación que mejora eficazmente las capacidades de un modelo lingüístico basando el resultado en información externa relevante. Este enfoque es especialmente valioso en situaciones que requieren respuestas precisas y contextualizadas (por ejemplo, atención al cliente, investigación académica, etc.). A medida que la IA sigue evolucionando, la RAG destaca por su potencial para construir sistemas de IA más fiables y sensibles al contexto.

condiciones previas

Preferido Python 3.11
Jupyter Notebook o JupyterLab
Clave API LLM
- Se puede utilizar cualquier LLM. En este cuaderno, utilizamos OpenAI y GPT-4o-mini.

Con estos pasos, podrá implantar un sistema RAG básico que incorpore información actualizada del mundo real para mejorar la eficacia de su modelo lingüístico en diversas aplicaciones.