H2O GPT: configuração flexível de ferramentas nativas de diálogo e processamento de documentos de IA

Recursos mais recentes de IAPublicado há 9 meses Círculo de compartilhamento de IA

12.8K 00

Introdução geral

O H2O GPT é um projeto de código aberto que tem como objetivo fornecer recursos privatizados de bate-papo e processamento de documentos. O projeto é baseado na licença Apache 2.0 e oferece suporte a vários modelos de GPT, incluindo LLaMa2, Mistral, Falcon e outros. Os usuários podem consultar e resumir documentos locais (por exemplo, PDF, Excel, Word, imagens, vídeos etc.) com o H2O GPT, garantindo a privacidade e a segurança dos dados. O H2O GPT oferece uso eficiente do contexto e extração paralela de resumos, suporta vários modelos para GPU e CPU e é adequado para vários cenários de aplicativos, como gerenciamento de documentos, construção de bases de conhecimento e perguntas e respostas inteligentes, etc. O H2O GPT oferece um uso eficiente do contexto e extração paralela de resumos, suporta vários modelos para GPU e CPU e é adequado para vários cenários de aplicativos, como gerenciamento de documentos, construção de bases de conhecimento e perguntas e respostas inteligentes, etc. O H2O GPT oferece uso eficiente do contexto e extração paralela de resumos em GPUs e CPUs.

Lista de funções

Bate-papo privadoSuporte ao modelo GPT local para bate-papo privado.
processamento de arquivosSuporte a consultas e resumos de vários formatos de documentos, incluindo PDF, Excel, Word, imagens, vídeos, etc.
Suporte a vários modelosCompatível com LLaMa2, Mistral, Falcon e muitos outros modelos GPT.
Uso contextual eficienteUse LLMs com ajuste de instrução sem o método de poucos disparos do LangChain.
Extração de resumo paraleloSuporte ao processamento paralelo para aumentar a eficiência da extração de resumos.
Suporte a GPU e CPUCompatível com uma ampla gama de configurações de hardware e suporta a operação eficiente de GPUs e CPUs.
UI ou CLI do GradioInterface de linha de comando: fornece uma interface amigável e uma interface de linha de comando.
Geração de imagensSuporte a modelos de geração de imagens, como o Stable Diffusion.
Reconhecimento e síntese de fala: Suporte Sussurro Reconhecimento de fala e vários modelos de síntese de fala.

Usando a Ajuda

Processo de instalação

projeto de clonagemExecute o seguinte comando em um terminal para clonar o projeto H2O GPT:

   git clone https://github.com/h2oai/h2ogpt.git
cd h2ogpt

Instalação de dependênciasInstale as dependências do projeto usando o seguinte comando:

   pip install -r requirements.txt

Ambiente de configuraçãoModificar conforme necessário .env parâmetros de configuração no arquivo.
Início dos serviçosExecute o seguinte comando para iniciar o serviço H2O GPT:

   python app.py

Diretrizes para uso

Bate-papo privado

Iniciar a interface de bate-papo: Acesso http://localhost:5000 Abra a interface do Gradio UI.
Selecione o modeloSelecione o modelo de GPT desejado na interface, por exemplo, LLaMa2, Mistral, etc.
Problemas de entradaDigite sua pergunta ou consulta na caixa de entrada e clique no botão "Enviar".
Exibir resultadosResposta: O sistema retornará um resumo da resposta ou do documento gerado.

processamento de arquivos

Fazer upload de um documentoNa interface do usuário do Gradio, clique no botão "Upload Document" (Carregar documento) e selecione o arquivo de documento que você deseja processar.
Seleção do tratamentoSelecione a função "Enquiry" (Consulta) ou "Summary" (Resumo) e insira a solicitação de consulta ou resumo relevante.
Exibir resultadosO sistema retornará o conteúdo do documento processado ou as informações resumidas.

Geração de imagens

Selecione o modelo de geração de imagemNa interface de usuário do Gradio, selecione um modelo de geração de imagem, como Difusão estável.
Descrição da entradaDigite uma descrição da imagem na caixa de entrada e clique no botão "Generate" (Gerar).
Exibir imagem geradaO sistema retornará a imagem gerada, que pode ser baixada ou editada posteriormente pelo usuário.

Reconhecimento e síntese de fala

Carregamento de arquivos de áudioNa interface do Gradio UI, clique no botão "Upload Audio" e selecione o arquivo de áudio que você deseja processar.
Seleção do tratamentoSelecione a função "Speech Recognition" (Reconhecimento de fala) ou "Speech Synthesis" (Síntese de fala) e insira os parâmetros relevantes.
Exibir resultadosO sistema retornará o texto reconhecido ou o arquivo de fala sintetizada.