Introdução geral
LocalPdfBate-papoO RAG é um projeto de código aberto que tem como objetivo possibilitar o bate-papo inteligente combinando documentos PDF locais com modelos Retrieval Augmented Generation (RAG). O projeto permite que os usuários façam upload de documentos PDF e, por meio de perguntas em linguagem natural, obtenham informações relevantes do documento.PdfBate-papoA RAG utiliza tecnologia avançada de processamento de linguagem natural para fornecer serviços eficientes e precisos de recuperação de conteúdo de documentos e de perguntas e respostas para uma ampla gama de cenários, incluindo pesquisa acadêmica e gerenciamento de documentos corporativos.
Lista de funções
- Upload de documentos PDFOs usuários podem fazer upload de documentos PDF locais e o sistema analisará e extrairá automaticamente o conteúdo do texto.
- Teste de linguagem naturalOs usuários podem fazer perguntas em linguagem natural e o sistema recuperará informações relevantes do documento PDF carregado e gerará respostas.
- integração de informações de várias fontesSuporte para combinação de documentos PDF locais e resultados de pesquisa na Web para fornecer respostas mais abrangentes.
- vetorizaçãoVetorização de texto usando modelos de incorporação para melhorar a recuperação e a precisão de perguntas e respostas.
- Configuração da variável de ambienteSuporte à configuração de chaves de API e outros parâmetros por meio de arquivos .env para configurações definidas pelo usuário.
Usando a Ajuda
Processo de instalação
- projeto de clonagemExecute o seguinte comando no terminal para clonar o código do projeto:
git clone https://github.com/weiwill88/Local_Pdf_Chat_RAG.git
- Instalação de dependênciasInstalação de dependências: Vá para o diretório do projeto e instale as dependências necessárias:
cd Local_Pdf_Chat_RAG
pip install -r requirements.txt
- Configuração de variáveis de ambiente: Criar um
.env
e adicione o seguinte:
SERPAPI_KEY=your_serpapi_key
comandante-em-chefe (militar)your_serpapi_key
Substitua-o por sua chave SerpAPI.
Processo de uso
- Início dos serviçosExecute o seguinte comando no terminal para iniciar o serviço:
python rag_demo.py
- Carregar documentos em PDFAbra o navegador para acessar o endereço de serviço local e carregue o documento PDF que precisa ser processado.
- fazer perguntasDigite sua pergunta na caixa de entrada e o sistema recuperará as informações relevantes do documento PDF carregado e gerará uma resposta.
Operação detalhada da função
- Upload de documentos PDFClique no botão de upload, selecione o arquivo PDF local, o sistema analisará automaticamente o conteúdo do documento e o armazenará no banco de dados.
- Teste de linguagem naturalDigite uma pergunta na caixa de entrada, por exemplo, "What is the main conclusion of this paper?" (Qual é a principal conclusão deste artigo?). O sistema extrairá os parágrafos relevantes do documento PDF e gerará uma resposta.
- integração de informações de várias fontesO sistema não apenas recuperará informações de documentos PDF locais, mas também realizará pesquisas na Web por meio da SerpAPI, integrando várias fontes de informação para fornecer respostas mais abrangentes.
- vetorizaçãoO sistema usa o modelo SentenceTransformer para vetorizar o texto a fim de garantir alta precisão na recuperação e nas perguntas e respostas.
- Configuração da variável de ambienteOs usuários podem modificar os parâmetros no arquivo .env para configurar chaves de API, mecanismos de pesquisa etc. para atender a necessidades individuais.