Aprendizagem pessoal com IA
e orientação prática

NV Ingest: análise de documentos de formato complexo e extração de dados multimodais em metadados e texto

Introdução geral

O NV Ingest (NVIDIA Ingest) é um conjunto de microsserviços de acesso antecipado projetado para analisar centenas de milhares de PDFs não estruturados complexos e confusos e outros documentos corporativos. O NVIDIA Ingest é compatível com a análise de documentos PDF, Word e PowerPoint, usando os microsserviços NVIDIA NIM para localizar, contextualizar e extrair texto, tabelas, gráficos e imagens para uso por aplicativos geradores downstream. O serviço paraleliza o processamento, divide os documentos em páginas, categoriza o conteúdo (por exemplo, tabelas, gráficos, imagens, texto) e o extrai em esquemas JSON bem definidos usando o reconhecimento óptico de caracteres (OCR). O NVIDIA Ingest também gerencia opcionalmente o cálculo do conteúdo incorporado e o armazena no banco de dados vetorial, Milvus.

NV Ingest: análise de documentos de formato complexo e extração de dados multimodais em metadados e texto-1

Arquivo de ajuda: https://docs.nvidia.com/nv-ingest/


 

Lista de funções

  • Suporte para análise de documentos PDF, Word e PowerPoint
  • Localize, contextualize e extraia textos, tabelas, gráficos e imagens com os microsserviços NVIDIA NIM
  • Paralelizar documentos, dividi-los em páginas e categorizar o conteúdo
  • Extração de conteúdo via OCR e conversão para o esquema JSON
  • Oferece suporte a métodos de extração para vários tipos de documentos para equilibrar a produtividade e a precisão
  • Oferece suporte a uma variedade de operações de pré e pós-processamento, incluindo divisão e fragmentação de texto, conversão e filtragem, geração de incorporação e descarregamento de imagens para armazenamento
  • Opcionalmente, gerencia o cálculo e o armazenamento do conteúdo incorporado no banco de dados de vetores Milvus

 

Usando a Ajuda

Processo de instalação

  1. Clone o repositório NVIDIA Ingest:
   git clone https://github.com/NVIDIA/nv-ingest.git
  1. Vá para o catálogo de projetos:
   cd nv-ingest
  1. Instalar dependências:
   pip install -r requirements.txt
  1. Configurar variáveis de ambiente:
   fonte setup_env.sh
  1. Inicie o serviço:
   docker-compose up

Processo de uso

  1. Enviar uma tarefa de análise de documentos::
    • Envie descrições de trabalho JSON contendo cargas de documentos e tarefas de análise por meio da API.
    • Exemplo de descrição de cargo JSON:
     {
    "document_payload": "base64_encoded_document", "document_tasks": ["parse_text", "extract_metadata"], ["parse_text", "extract_metadata"]
    "ingestion_tasks": ["parse_text", "extract_metadata"]
    }
    
  2. Recuperar resultados da análise::
    • Recupere os resultados do trabalho por meio da API, resultando em um dicionário JSON que contém metadados de objetos extraídos, anotações de processamento e dados de tempo/rastreamento.
    • Exemplos de chamadas de API:
     curl -X GET "http://localhost:5000/api/results/{job_id}"
    
  3. Tipos de documentos e métodos de extração compatíveis::
    • Documentos PDF: suporte para extração via pdfium, Unstructured.io e Adobe Content Extraction Services.
    • Documentos do Word: suporte à extração por meio da API do Microsoft Office.
    • Documentos do PowerPoint: há suporte para extração por meio da API do Microsoft Office.
    • Imagens: há suporte para extração via OCR.
  4. Operações de pré e pós-processamento::
    • Divisão e fragmentação de texto: divisão de textos longos em partes menores para melhor processamento e análise.
    • Conversão e filtragem: converta e filtre o texto extraído para melhorar a qualidade dos dados.
    • Geração de incorporação: calcula a incorporação do conteúdo extraído para armazenamento e recuperação em um banco de dados vetorial.
    • Descarregamento de imagens para armazenamento: descarrega imagens extraídas para armazenamento externo para processamento e análise adicionais.

Procedimento de operação detalhado

  1. Enviar uma tarefa de análise de documentos::
    • Envie descrições de trabalho JSON contendo cargas de documentos e tarefas de análise por meio da API.
    • Exemplo de descrição de cargo JSON:
     {
    "document_payload": "base64_encoded_document", "document_tasks": ["parse_text", "extract_metadata"], ["parse_text", "extract_metadata"]
    "ingestion_tasks": ["parse_text", "extract_metadata"]
    }
    
  2. Recuperar resultados da análise::
    • Recupere os resultados do trabalho por meio da API, resultando em um dicionário JSON que contém metadados de objetos extraídos, anotações de processamento e dados de tempo/rastreamento.
    • Exemplos de chamadas de API:
     curl -X GET "http://localhost:5000/api/results/{job_id}"
    
  3. Tipos de documentos e métodos de extração compatíveis::
    • Documentos PDF: suporte para extração via pdfium, Unstructured.io e Adobe Content Extraction Services.
    • Documentos do Word: suporte à extração por meio da API do Microsoft Office.
    • Documentos do PowerPoint: há suporte para extração por meio da API do Microsoft Office.
    • Imagens: há suporte para extração via OCR.
  4. Operações de pré e pós-processamento::
    • Divisão e fragmentação de texto: divisão de textos longos em partes menores para melhor processamento e análise.
    • Conversão e filtragem: converta e filtre o texto extraído para melhorar a qualidade dos dados.
    • Geração de incorporação: calcula a incorporação do conteúdo extraído para armazenamento e recuperação em um banco de dados vetorial.
    • Descarregamento de imagens para armazenamento: descarrega imagens extraídas para armazenamento externo para processamento e análise adicionais.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " NV Ingest: análise de documentos de formato complexo e extração de dados multimodais em metadados e texto

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil