Aprendizagem pessoal com IA
e orientação prática

OmniParse: extrai quaisquer dados não estruturados de documentos/multimídia e os analisa em dados estruturados

Introdução geral

O OmniParse é uma poderosa plataforma de análise e otimização de dados projetada para transformar quaisquer dados não estruturados em dados estruturados e acionáveis otimizados para estruturas de GenAI (Inteligência Artificial Generativa). Independentemente de você estar trabalhando com documentos, tabelas, imagens, vídeos, arquivos de áudio ou conteúdo da Web, o OmniParse torna seus dados limpos, estruturados e prontos para aplicativos de IA, como RAG (Retrieval Augmented Generation) e ajuste fino.

OmniParse: extraia qualquer dado não estruturado de documentos/multimídia e analise-o em dados estruturados-1


 

OmniParse: extraia qualquer dado não estruturado de documentos/multimídia e analise-o em dados estruturados-1
Endereço de demonstração de código aberto: https://colab.research.google.com/github/adithya-s-k/omniparse/blob/main/examples/OmniParse_GoogleColab.ipynb

 

Lista de funções

  • Totalmente localizado, sem necessidade de API externa
  • Para GPUs T4
  • Suporta cerca de 20 tipos de arquivos
  • Converta documentos, multimídia e páginas da Web em Markdown estruturado de alta qualidade
  • Extração de tabelas, extração/legenda de imagens, transcrição de áudio/vídeo, rastreamento da Web
  • Implementação fácil com o Docker e o Skypilot
  • Ambiente de colaboração amigável
  • UI interativa com tecnologia Gradio

Usando a Ajuda

Processo de instalação

  1. armazém de clones::
    git clone https://github.com/adithya-s-k/omniparse
    cd omniparse
    
  2. Criação de um ambiente virtual::
    conda create -n omniparse-venv python=3.10
    conda activate omniparse-venv
    
  3. Instalação de dependências::
    instalação de poesia
    # ou
    pip install -e .
    # ou
    pip install -r pyproject.toml
    

Usando o Docker

  1. Extração de imagens da API do OmniParse do Docker Hub::
    docker pull savatar101/omniparse:0.1
    
  2. Execute o contêiner do Docker, expondo a porta 8000::
    # Se estiver usando uma GPU
    docker run --gpus all -p 8000:8000 savatar101/omniparse:0.1
    # Caso contrário
    docker run -p 8000:8000 savatar101/omniparse:0.1
    

Servidor de operações

  1. Iniciar o servidor::
    python server.py --host 0.0.0.0 --port 8000 --documents --media --web
    
    • --documentosCarregamento de todos os modelos que ajudam a analisar e ingerir documentos (por exemplo, a família de modelos Surya OCR e Florence-2).
    • -mídiaCarregamento de modelos Whisper para transcrever arquivos de áudio e vídeo.
    • --webConfiguração do rastreador Selenium.

Tipos de dados suportados

  • Arquivo (de computador)::.doc.docx.pdf.ppt.pptx
  • imagens::.png.jpg.jpeg.tiff.bmp.heic
  • vídeo::.mp4.mkv.avi.mov
  • frequência sonora::.mp3.wav.aac
  • página da web: páginas dinâmicas da Web.http://.com

exemplo de uso

  1. resolução de documentos::
    python server.py --host 0.0.0.0 --port 8000 --documents
    

    Isso carrega todos os modelos de análise de documentos prontos para processar dados do tipo de documento.

  2. análise de multimídia::
    python server.py --host 0.0.0.0 --port 8000 --media
    

    Isso carrega o modelo Whisper pronto para processar arquivos de áudio e vídeo.

  3. rastreador da web::
    python server.py --host 0.0.0.0 --port 8000 --web
    

    Isso configurará o rastreador Selenium, pronto para processar o conteúdo da Web.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " OmniParse: extrai quaisquer dados não estruturados de documentos/multimídia e os analisa em dados estruturados

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil