Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

AI Engineering Academy: 2.14 RAPTOR: processamento de resumo recursivo para geração aprimorada de recuperação estruturada em árvore

introdutório

O RAPTOR (Recursive Abstract Processing for Tree-Structured Retrieval Enhanced Generation) é um método avançado de geração aprimorada de recuperação (RAG). Ele aprimora o tradicional introduzindo técnicas de estruturação e resumo de documentos hierárquicos para RAG Processo.

https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/09_RAPTOR


 

locomotiva

Os sistemas RAG tradicionais geralmente enfrentam dificuldades com grandes coleções de documentos e consultas complexas. O raptor aborda esses desafios criando uma representação hierárquica do corpus de documentos, o que permite uma recuperação mais detalhada e eficiente.

Detalhes metodológicos

 

Pré-processamento de documentos e criação de armazenamento de vetores

  1. Divida os documentos em partes gerenciáveis.
  2. Incorpore cada nugget usando um modelo de incorporação adequado.
  3. Agrupamento de vetores de incorporação para agrupar conteúdo semelhante.
  4. Os resultados do agrupamento são resumidos para criar uma representação abstrata de nível superior.
  5. Uma estrutura de árvore hierárquica (árvore RAPTOR) foi construída usando esses resumos e os blocos de texto originais.

Fluxo de trabalho de geração de aprimoramento de recuperação

  1. As consultas do usuário são incorporadas usando o mesmo modelo de incorporação.
  2. Percorre a árvore RAPTOR para encontrar nós relacionados (resumos ou blocos de documentos).
  3. Mesclar os resultados da pesquisa com a consulta original do usuário para formar um contexto.
  4. Esse contexto é passado para o Modelo de Linguagem Grande (LLM) para gerar a resposta final.

Principais recursos do RAPTOR

  • Representação hierárquica de documentos: cria uma estrutura em árvore do conteúdo do documento.
  • Resumo em vários níveis: as informações de resumo são fornecidas em diferentes níveis.
  • Recuperação eficiente: recuperação de informações mais rápida e mais relevante por meio da passagem pela árvore.
  • Escalabilidade: melhor manuseio de grandes coleções de documentos em comparação com o armazenamento de vetores planos.

Vantagens desse método

  1. Relevância contextual aprimorada: a estrutura hierárquica combina melhor as consultas com o conteúdo relevante.
  2. A busca na floresta é mais eficiente: a abordagem de passagem pela árvore é mais eficiente em comparação com a busca completa.
  3. Tratamento de consultas complexas: a estrutura multinível ajuda a tratar consultas de informações em várias seções de documentos.
  4. Lida com grandes conjuntos de documentos: melhor escalabilidade do que os métodos tradicionais.

chegar a um veredicto

O RAPTOR aprimora a qualidade e a eficiência do processo RAG, introduzindo mecanismos de recuperação e representação de documentos resumidos e estruturados em árvore. Espera-se que essa abordagem melhore significativamente a precisão e a relevância contextual da recuperação de informações, especialmente para coleções de documentos complexos em grande escala.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " AI Engineering Academy: 2.14 RAPTOR: processamento de resumo recursivo para geração aprimorada de recuperação estruturada em árvore
pt_BRPortuguês do Brasil