Aprendizagem pessoal com IA
e orientação prática

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Este artigo foi atualizado em 2025-01-19 14:53, parte do conteúdo é sensível ao tempo, se for inválido, por favor, deixe uma mensagem!

Introdução geral

O MiniRAG é uma estrutura de Geração Aumentada de Recuperação (RAG) extremamente simples que visa obter um bom desempenho de RAG mesmo para modelos pequenos por meio de indexação de gráficos heterogêneos e recuperação leve com aprimoramento de topologia. Desenvolvido pelo Laboratório de Ciência de Dados da Universidade de Hong Kong (HKUDS), o projeto se concentra na solução do problema de degradação de desempenho enfrentado pelos modelos de linguagem pequenos (SLMs) nas estruturas RAG existentes. O miniRAG reduz a dependência de uma compreensão semântica complexa combinando pedaços de texto e entidades nomeadas em uma única estrutura unificada e explora estruturas de gráficos para a descoberta eficiente de conhecimento. A estrutura atinge um desempenho comparável com apenas 251 TP3T de espaço de armazenamento da abordagem Large Language Model (LLM).

MiniRAG: estrutura de geração aprimorada de recuperação simplificada com blocos de texto relevantes incorporados ao gráfico de conhecimento-1


 

Lista de funções

  • Mecanismo de indexação de gráficos heterogêneos: combinação de blocos de texto e entidades nomeadas para reduzir a dependência de um entendimento semântico complexo.
  • Recuperação leve e aprimorada por topologia: descoberta eficiente de conhecimento usando estruturas de gráficos.
  • Compatível com modelos de linguagem pequenos: fornecendo desempenho RAG eficiente em cenários com recursos limitados.
  • Conjunto de dados de referência abrangente: o conjunto de dados LiHua-World é fornecido para avaliar o desempenho de sistemas RAG leves em consultas complexas.
  • Fácil instalação: suporta a instalação a partir do código-fonte e do PyPI.

 

Usando a Ajuda

Processo de instalação

Instalação a partir da fonte (recomendado)

  1. Clonagem do repositório MiniRAG:
   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG
  1. Instale a dependência:
   pip install -e .

Instalação a partir do PyPI

O MiniRAG é baseado no LightRAG e, portanto, pode ser instalado diretamente:

pip install lightrag-hku

Início rápido

  1. Faça o download do conjunto de dados necessário e coloque-o na pasta. /datasetcatálogo. Por exemplo, o conjunto de dados LiHua-World foi colocado no catálogo. /dataset/LiHua-World/data/Catálogo.
  2. Use o seguinte comando para indexar o conjunto de dados:
   python . /reproduce/Step_0_index.py
  1. Execute o módulo de perguntas e respostas:
   python . /reproduce/Step_1_QA.py
  1. Como alternativa, use o. /main.pyO código em inicializa o MiniRAG.

Funções principais

Mecanismo de indexação de gráficos heterogêneos

O MiniRAG cria índices de gráficos heterogêneos combinando blocos de texto e entidades nomeadas em uma estrutura unificada. Os usuários podem conseguir isso seguindo as etapas abaixo:

  1. Prepare o conjunto de dados e certifique-se de que o conjunto de dados esteja formatado conforme necessário.
  2. Execute o script de indexação:
   python . /reproduce/Step_0_index.py
  1. Após a conclusão da indexação, os dados serão armazenados no diretório especificado para recuperação posterior.

Pesquisa aprimorada de topologia leve

O MiniRAG utiliza a estrutura do gráfico para a descoberta eficiente de conhecimento, que pode ser recuperado pelo usuário nas etapas a seguir:

  1. Inicialize o MiniRAG:
   from minirag import MiniRAG
modelo = MiniRAG()
  1. Carregue o conjunto de dados e recupere-o:
   resultados = model.retrieve("sua consulta")
  1. Processa os resultados da pesquisa e gera uma resposta:
   resposta = model.generate(results)

Com as etapas acima, os usuários podem aproveitar ao máximo os recursos do MiniRAG para a geração eficiente de aprimoramentos de pesquisa.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil