Introdução geral
O Rowfill é uma plataforma de processamento de documentos de código aberto projetada para profissionais do conhecimento. Ele usa tecnologias avançadas de IA para extrair, analisar e processar dados de documentos, imagens e PDFs complexos. O Rowfill oferece suporte a modelos nativos de linguagem grande (LLM) e modelos visuais OpenAI para garantir a privacidade e a segurança dos dados. A plataforma oferece funcionalidade de OCR (Optical Character Recognition, reconhecimento óptico de caracteres) de alta precisão que gera automaticamente estruturas de documentos e permite que os usuários criem fluxos de trabalho personalizados para automatizar o processamento de tarefas. O Rowfill é totalmente de código aberto sob a licença AGPLv3, permitindo que os usuários usem e contribuam livremente com o código.
Outras ferramentas que podem extrair dados estruturados de PDF:Parsio mas o Rowfill é mais adequado para analisar dados de conversas pós-feriado.
Lista de funções
- Processamento e OCR avançadosExtração de texto, tabelas e escrita à mão com alta precisão
- Geração automática da estrutura do documentoDetecta e se adapta automaticamente a diferentes estruturas de documentos
- Fluxo de trabalho personalizadoCrie fluxos de trabalho personalizados para o processamento automatizado de tarefas
- Suporte ao LLM nativoSuporte para grandes modelos de idiomas locais, como Llama, Mistral
- Privacidade e segurança dos dadosSincronização dos dados da empresa para garantir a privacidade dos dados
- projeto de código abertoBaseado na licença AGPLv3, totalmente de código aberto
- versão em nuvemVersão alfa do serviço de nuvem disponível
Usando a Ajuda
Processo de instalação
- Execute o arquivo do Docker Compose::
- Faça o download e instale o Docker.
- Clone o repositório Rowfill:
git clone https://github.com/harishdeivanayagam/rowfill.git
- Vá para o catálogo de projetos:
cd rowfill
- Execute o Docker Compose:
docker-compose up
- Configuração de variáveis de ambiente::
- consulta
mockenv
para configurar as variáveis de ambiente necessárias.
- consulta
- Iniciar a extração de dados::
- Quando a configuração estiver concluída, inicie o serviço e comece a extrair dados do documento.
Função Fluxo de operação
- processamento de arquivos::
- Faça upload de documentos (vários formatos compatíveis, por exemplo, PDF, imagens).
- Extraia texto, tabelas e conteúdo manuscrito usando recursos avançados de OCR.
- Gerar automaticamente estruturas de documentos para facilitar o acompanhamento.
- Criar fluxos de trabalho personalizados::
- Vá para a tela de criação do fluxo de trabalho.
- Selecione as tarefas que precisam ser automatizadas (por exemplo, extração de dados, análise).
- Configure os parâmetros da tarefa, salve e execute o fluxo de trabalho.
- Suporte ao LLM nativo::
- Configure o modelo local de linguagem grande (por exemplo, Llama, Mistral).
- Sincronize os dados da empresa para garantir a privacidade e a segurança dos dados.
- Uso da versão em nuvem::
- Acesso à versão Rowfill Cloud (Alpha).
- Registre-se e faça login na sua conta para começar a usar o serviço de nuvem.
Exemplo de operação detalhada
- Exemplo 1: Extrair dados de tabela do PDF::
- Faça upload de um arquivo PDF.
- Selecione a função "Table Extraction" (Extração de tabela).
- O sistema reconhece e extrai automaticamente os dados do formulário para gerar arquivos de dados estruturados.
- Exemplo 2: Criação de um fluxo de trabalho de análise de dados automatizado::
- Vá para a tela de criação do fluxo de trabalho.
- Selecione a tarefa Análise de dados.
- Configure os parâmetros de análise (por exemplo, fonte de dados, método de análise).
- Salve e execute o fluxo de trabalho, o sistema conclui automaticamente a análise de dados e gera relatórios.