Instituto de Engenharia de IA: 2.9 Sentence Window Retrieval Augmented Generation (RAG)

Base de conhecimento de IAAtualizado há 8 meses Círculo de compartilhamento de IA

1.5K 00

introdutório

O método RAG (Retrieval-Augmented Generation) baseado em janelas de frases é RAG Uma implementação de alto nível de uma estrutura projetada para aprimorar a consciência do contexto e a coerência das respostas geradas por IA. A abordagem combina o poder de grandes modelos de linguagem com técnicas eficientes de recuperação de informações para fornecer uma solução confiável para gerar respostas de alta qualidade e ricas em contexto.

https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/04_Sentence_Window_RAG

locomotiva

Os sistemas RAG convencionais geralmente têm dificuldades para manter a coerência em contextos maiores ou apresentam desempenho inadequado ao lidar com informações que abrangem vários blocos de texto. As abordagens de geração aprimorada de recuperação baseada em janela de sentença tratam dessa limitação preservando as relações contextuais entre os blocos de texto durante o processo de indexação e utilizando essas informações no processo de recuperação e geração.

Detalhes metodológicos

Pré-processamento de documentos e criação de armazenamento de vetores

Divisão de documentosDividir o documento de entrada em frases.
Criação de blocos de textoAgrupamento de frases em pedaços gerenciáveis de texto.
representação incorporadaCada bloco de texto é processado por meio de um modelo de incorporação para gerar uma representação vetorial.
Índice do banco de dados vetorialIDs de blocos de texto: armazena as IDs de blocos de texto, o conteúdo do texto e os vetores de incorporação em um banco de dados de vetores para uma pesquisa de similaridade eficiente.
Índice da estrutura do documentoBanco de dados: Um banco de dados separado é usado para armazenar as relações entre blocos de texto, incluindo referências de cada bloco aos blocos anteriores e posteriores.

Fluxo de trabalho de geração de aprimoramento de recuperação

processamento de consultasRepresentação incorporada das consultas do usuário usando o mesmo modelo de incorporação dos blocos de texto.
Pesquisa de similaridadeUse vetores de incorporação de consulta para recuperar os blocos de texto mais relevantes no banco de dados de vetores.
extensão de contexto (computação)Para cada bloco de texto recuperado, k blocos de texto anteriores e posteriores são obtidos do banco de dados da estrutura do documento para expansão do contexto.
combinação contextualCombinação: Combine o bloco de texto recuperado e seu contexto estendido com a consulta original.
Geração de uma respostaPassa o contexto estendido e a consulta para o modelo de linguagem grande para gerar a resposta final.

Principais recursos do RAG

Recuperação eficiente: Recuperação rápida e precisa de informações por meio de pesquisa de similaridade de vetores.
Reservas contextuaisMantém a relação entre a estrutura do documento e os blocos de texto durante a fase de indexação.
Janela de contexto flexívelJanela de contexto: Permite redimensionar a janela de contexto durante a fase de recuperação.
escalabilidadePode lidar com grandes coleções de documentos, bem como com diversos tipos de consultas.

Vantagens do método

Aumentar a coerênciaInformações contextuais: as informações contextuais são aprimoradas pela introdução de blocos de texto ao redor, resultando em respostas mais coerentes e contextualmente precisas.
Redução das alucinaçõesO modelo é capaz de gerar respostas com base nas informações recuperadas, reduzindo a probabilidade de gerar conteúdo falso ou irrelevante.
Eficiência de armazenamentoOtimize o espaço de armazenamento armazenando apenas as informações necessárias no banco de dados de vetores.
Janela de contexto ajustávelJanela de contexto: redimensione dinamicamente a janela de contexto de acordo com as necessidades de diferentes consultas ou aplicativos.
Retenção da estrutura do documentoManutenção da estrutura e do fluxo do documento original: a manutenção da estrutura e do fluxo do documento original permite que a IA compreenda e gere o documento de uma forma mais diferenciada.

resumos

A abordagem RAG (Retrieval Augmented Generation) baseada em Sentence Window oferece uma solução poderosa para melhorar a qualidade e a relevância contextual das respostas geradas por IA. Ao preservar a estrutura do documento e oferecer suporte a extensões de contexto flexíveis, a abordagem aborda com eficácia algumas das principais limitações dos sistemas RAG tradicionais. Ela oferece uma estrutura confiável para a criação de sistemas avançados de perguntas e respostas, análise de documentos e aplicativos de geração de conteúdo.