PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems (Ferramenta de geração de aumento de recuperação paramétrica para melhorar o desempenho dos sistemas de perguntas e respostas)

Recursos mais recentes de IAPublicado há 7 meses Círculo de compartilhamento de IA

15.1K 00

Introdução geral

O PRAG (Parametric Retrieval-Augmented Generation) é uma ferramenta inovadora de geração aumentada por recuperação, projetada para aprimorar a geração por meio da incorporação de conhecimento externo diretamente no espaço de parâmetros de um modelo de linguagem grande (LLM). A ferramenta supera as limitações dos métodos tradicionais de geração aumentada por recuperação contextual, reduz as despesas gerais de computação e aprimora os recursos de raciocínio e síntese do modelo, integrando profundamente o conhecimento externo. O PRAG oferece implementações completas, incluindo um módulo de aprimoramento de dados, um módulo de treinamento de parâmetros e um módulo de inferência para testes de desempenho de vários conjuntos de dados de questionários.

Lista de funções

Módulo de aprimoramento de dadosConverta documentos em conjuntos de dados aprimorados com dados.
Módulo de treinamento de parâmetrosTreinamento de parâmetros LoRA adicionais para gerar uma representação parametrizada do documento.
módulo de inferênciaFusão de representações parametrizadas de documentos relacionados e sua inserção no LLM para inferência.
Instalação do ambienteInformações sobre o ambiente: Fornece etapas e dependências detalhadas da instalação do ambiente.
autoaperfeiçoamentoSuporte ao uso direto de arquivos de dados pré-aprimorados ou aprimoramentos de dados autoprocessados.
Preparação da pesquisaDownload e preparação de conjuntos de dados da Wikipédia para recuperação.

Usando a Ajuda

Instalação do ambiente

Criar e ativar um ambiente virtual:

   conda create -n prag python=3.10.4
conda activate prag

Instale as dependências necessárias:

   pip install torch==2.1.0
pip install -r requirements.txt

modificações src/root_dir_path.py acertou em cheio ROOT_DIR é o endereço da pasta em que o PRAG está armazenado.

Aprimoramento de dados

Use arquivos de dados pré-aprimorados:

   tar -xzvf data_aug.tar.gz

Aprimoramento de dados de autoprocessamento:
- Faça o download do conjunto de dados da Wikipédia: bash mkdir -p data/dpr wget -O data/dpr/psgs_w100.tsv.gz https://dl.fbaipublicfiles.com/dpr/wikipedia_split/psgs_w100.tsv.gz
- pretender BM25 Recuperado: bash # 具体步骤请参考项目文档

treinamento paramétrico

Gerar uma representação parametrizada do documento:

   # 具体步骤请参考项目文档

inferência

As representações parametrizadas de documentos relacionados são mescladas e inseridas no LLM para inferência:

   # 具体步骤请参考项目文档

Recursos mais recentes de IA # Projeto de código aberto AI Java # Recuperação de conhecimento e estrutura RAG

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Fireflies.ai: assistente de reunião inteligente com transcrição e análise automatizadas de reuniões

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA

1 ano atrás

016.2K

MemFree: um mecanismo de pesquisa de IA que combina bases de conhecimento locais com informações de pesquisa

Recursos mais recentes de IA # Projeto de código aberto AI Java Ferramenta de busca # AI

11 meses atrás

013.8K

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

8 meses atrás

017.1K

Vanna: uso de técnicas RAG para gerar consultas SQL precisas a partir de texto

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA # Recuperação de conhecimento e estrutura RAG

8 meses atrás

015.2K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems (Ferramenta de geração de aumento de recuperação paramétrica para melhorar o desempenho dos sistemas de perguntas e respostas)

Introdução geral

Lista de funções

Usando a Ajuda

Instalação do ambiente

Aprimoramento de dados

treinamento paramétrico

inferência

Pesquisador GPT: gere relatórios de pesquisa abrangentes e detalhados usando dados locais e baseados na Web

Rowfill: extração em lote de informações estruturadas de documentos e análise automatizada

Artigos relacionados

Fireflies.ai: assistente de reunião inteligente com transcrição e análise automatizadas de reuniões

MemFree: um mecanismo de pesquisa de IA que combina bases de conhecimento locais com informações de pesquisa

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Vanna: uso de técnicas RAG para gerar consultas SQL precisas a partir de texto

Sem comentários

Últimas coleções

Artigos mais recentes

PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems (Ferramenta de geração de aumento de recuperação paramétrica para melhorar o desempenho dos sistemas de perguntas e respostas)

Introdução geral

Lista de funções

Usando a Ajuda

Instalação do ambiente

Aprimoramento de dados

treinamento paramétrico

inferência

Pesquisador GPT: gere relatórios de pesquisa abrangentes e detalhados usando dados locais e baseados na Web

Rowfill: extração em lote de informações estruturadas de documentos e análise automatizada

Artigos relacionados

Fireflies.ai: assistente de reunião inteligente com transcrição e análise automatizadas de reuniões

MemFree: um mecanismo de pesquisa de IA que combina bases de conhecimento locais com informações de pesquisa

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Vanna: uso de técnicas RAG para gerar consultas SQL precisas a partir de texto

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes