Introdução geral
O Denser Chat é um projeto de chatbot desenvolvido e mantido pela denser.ai para extrair texto e tabelas de arquivos PDF e páginas da Web com destaque de código-fonte. O projeto oferece suporte à criação de chatbots baseados em denser-retriever e fornece aplicativos de chatbot Streamlit interativos. Os usuários podem implementar e usar rapidamente o chatbot para responder a perguntas relacionadas a PDF e conteúdo da Web com instalação e configuração simples.
Lista de funções
- Extraia texto e tabelas de arquivos PDF e páginas da Web
- Criação de um chatbot baseado no denser-retriever
- Suporte para aplicativos de chatbot Streamlit interativos
- Fornecer função de destaque de código-fonte
- Oferece suporte a vários formatos de arquivos e URLs como fontes de dados
- Iniciando os serviços do Elasticsearch e do Milvus com o Docker Compose
- Use OpenAI ou Claude API para fornecer funcionalidade de bate-papo
Usando a Ajuda
Processo de instalação
- Armazém de Clonagem:
git clone https://github.com/denser-org/denser-chat.git
- Vá para o diretório do projeto e inicie o ambiente virtual (certifique-se de que a versão do Python seja a 3.11):
cd denser-chat
python -m venv .venv
fonte .venv/bin/activate
- Instale os pacotes necessários:
pip install -e .
Ou use Poetry (Poesia):
instalação de poesia
Início rápido
- Antes de criar os índices, execute o Docker Compose para iniciar os serviços Elasticsearch e Milvus:
cd denser_chat
docker compose up -d
- Criação de um índice de chatbot:
python build.py sources.txt output test_index
onde o primeiro parâmetro é o arquivo usado para criar o chatbot, que pode ser um arquivo PDF local, um PDF de URL ou um URL. o segundo parâmetro é o diretório de saída e o terceiro parâmetro é o nome do índice.
- Inicie o servidor local para fornecer serviços de PDF:
python -m http.server 8000
- Inicie o aplicativo Streamlit:
cd denser_chat
streamlit run demo.py -- --index_name test_index
Funções de uso
- Extrair texto e tabelasFaça upload de um arquivo PDF ou insira o URL de uma página da Web, e o Denser Chat extrairá automaticamente o conteúdo do texto e da tabela.
- Destaque de código-fonteDurante o bate-papo, o Denser Chat destaca o código-fonte relevante no arquivo PDF para facilitar a visualização e a compreensão.
- bate-papo interativoConfiguração da OpenAI ou das chaves de API da Claude: ao configurar a OpenAI ou as chaves de API da Claude, os usuários podem interagir com os chatbots para obter respostas precisas.
Procedimento de operação detalhado
- Carregamento de arquivosSelecione e carregue um arquivo PDF na interface do aplicativo ou insira o URL de uma página da Web.
- fazer perguntasPerguntas: Digite perguntas na janela de bate-papo, como "O que é amostragem negativa em um lote?" ou "Quais peças têm pinos de parada?". .
- Exibir resultadosO Denser Chat retornará respostas com destaque, facilitando aos usuários a localização rápida do conteúdo relevante.