Introdução geral
O H2O GPT é um projeto de código aberto que tem como objetivo fornecer recursos privatizados de bate-papo e processamento de documentos. O projeto é baseado na licença Apache 2.0 e oferece suporte a vários modelos de GPT, incluindo LLaMa2, Mistral, Falcon e outros. Os usuários podem consultar e resumir documentos locais (por exemplo, PDF, Excel, Word, imagens, vídeos etc.) com o H2O GPT, garantindo a privacidade e a segurança dos dados. O H2O GPT oferece uso eficiente do contexto e extração paralela de resumos, suporta vários modelos para GPU e CPU e é adequado para vários cenários de aplicativos, como gerenciamento de documentos, construção de bases de conhecimento e perguntas e respostas inteligentes, etc. O H2O GPT oferece um uso eficiente do contexto e extração paralela de resumos, suporta vários modelos para GPU e CPU e é adequado para vários cenários de aplicativos, como gerenciamento de documentos, construção de bases de conhecimento e perguntas e respostas inteligentes, etc. O H2O GPT oferece uso eficiente do contexto e extração paralela de resumos em GPUs e CPUs.
Lista de funções
- Bate-papo privadoSuporte ao modelo GPT local para bate-papo privado.
- processamento de arquivosSuporte a consultas e resumos de vários formatos de documentos, incluindo PDF, Excel, Word, imagens, vídeos, etc.
- Suporte a vários modelosCompatível com LLaMa2, Mistral, Falcon e muitos outros modelos GPT.
- Uso contextual eficienteUse LLMs com ajuste de instrução sem o método de poucos disparos do LangChain.
- Extração de resumo paraleloSuporte ao processamento paralelo para aumentar a eficiência da extração de resumos.
- Suporte a GPU e CPUCompatível com uma ampla gama de configurações de hardware e suporta a operação eficiente de GPUs e CPUs.
- UI ou CLI do GradioInterface de linha de comando: fornece uma interface amigável e uma interface de linha de comando.
- Geração de imagensSuporte a modelos de geração de imagens, como o Stable Diffusion.
- Reconhecimento e síntese de falaSuporte para reconhecimento de fala Whisper e vários modelos de síntese de fala.
Usando a Ajuda
Processo de instalação
- projeto de clonagemExecute o seguinte comando em um terminal para clonar o projeto H2O GPT:
git clone https://github.com/h2oai/h2ogpt.git
cd h2ogpt
- Instalação de dependênciasInstale as dependências do projeto usando o seguinte comando:
pip install -r requirements.txt
- Ambiente de configuraçãoModificar conforme necessário
.env
parâmetros de configuração no arquivo. - Início dos serviçosExecute o seguinte comando para iniciar o serviço H2O GPT:
python app.py
Diretrizes para uso
Bate-papo privado
- Iniciar a interface de bate-papo: Acesso
http://localhost:5000
Abra a interface do Gradio UI. - Selecione o modeloSelecione o modelo de GPT desejado na interface, por exemplo, LLaMa2, Mistral, etc.
- Problemas de entradaDigite sua pergunta ou consulta na caixa de entrada e clique no botão "Enviar".
- Exibir resultadosResposta: O sistema retornará um resumo da resposta ou do documento gerado.
processamento de arquivos
- Fazer upload de um documentoNa interface do usuário do Gradio, clique no botão "Upload Document" (Carregar documento) e selecione o arquivo de documento que você deseja processar.
- Seleção do tratamentoSelecione a função "Enquiry" (Consulta) ou "Summary" (Resumo) e insira a solicitação de consulta ou resumo relevante.
- Exibir resultadosO sistema retornará o conteúdo do documento processado ou as informações resumidas.
Geração de imagens
- Selecione o modelo de geração de imagemNa interface de usuário do Gradio, selecione um modelo de geração de imagem, como Difusão estável.
- Descrição da entradaDigite uma descrição da imagem na caixa de entrada e clique no botão "Generate" (Gerar).
- Exibir imagem geradaO sistema retornará a imagem gerada, que pode ser baixada ou editada posteriormente pelo usuário.
Reconhecimento e síntese de fala
- Carregamento de arquivos de áudioNa interface do Gradio UI, clique no botão "Upload Audio" e selecione o arquivo de áudio que você deseja processar.
- Seleção do tratamentoSelecione a função "Speech Recognition" (Reconhecimento de fala) ou "Speech Synthesis" (Síntese de fala) e insira os parâmetros relevantes.
- Exibir resultadosO sistema retornará o texto reconhecido ou o arquivo de fala sintetizada.