OmniParse : extrait des données non structurées de documents/multimédias et les analyse en données structurées.

Dernières ressources sur l'IAMise à jour il y a 10 mois Cercle de partage de l'IA

18.4K 00

Introduction générale

OmniParse est une puissante plateforme d'analyse et d'optimisation de données conçue pour transformer toutes les données non structurées en données structurées, exploitables et optimisées pour les frameworks GenAI (Generative Artificial Intelligence). Que vous travailliez avec des documents, des tableaux, des images, des vidéos, des fichiers audio ou du contenu web, OmniParse rend vos données propres, structurées et prêtes pour les applications d'IA telles que RAG (Retrieval Augmented Generation) et la mise au point.

: Adresse de la démo open source : https://colab.research.google.com/github/adithya-s-k/omniparse/blob/main/examples/OmniParse_GoogleColab.ipynb

Liste des fonctions

Entièrement localisé, aucune API externe n'est nécessaire
Pour les GPU T4
Prise en charge d'environ 20 types de fichiers
Convertir des documents, des supports multimédias et des pages web en Markdown structuré de haute qualité
Extraction de tableaux, extraction d'images/sous-titrage, transcription audio/vidéo, exploration du web
Déploiement facile avec Docker et Skypilot
Environnement de travail convivial
Interface utilisateur interactive optimisée par Gradio

Utiliser l'aide

Processus d'installation

entrepôt de clones: :

git clone https://github.com/adithya-s-k/omniparse
cd omniparse

Créer un environnement virtuel: :

conda create -n omniparse-venv python=3.10
conda activate omniparse-venv

Installation des dépendances: :

poetry install
# 或者
pip install -e .
# 或者
pip install -r pyproject.toml

Utilisation de Docker

Extraction des images de l'API OmniParse à partir de Docker Hub: :
```
docker pull savatar101/omniparse:0.1
```

Exécuter le conteneur Docker, en exposant le port 8000: :

# 如果使用GPU
docker run --gpus all -p 8000:8000 savatar101/omniparse:0.1
# 否则
docker run -p 8000:8000 savatar101/omniparse:0.1

Serveur d'opérations

Démarrer le serveur: :
```
python server.py --host 0.0.0.0 --port 8000 --documents --media --web
```
- --documentsChargement de tous les modèles qui permettent d'analyser et d'ingérer des documents (par exemple, la famille de modèles Surya OCR et Florence-2).
- --mediaLes modèles Whisper : Chargez des modèles Whisper pour transcrire des fichiers audio et vidéo.
- --web: Mise en place du crawler Selenium.

Types de données pris en charge

fichier (informatique): :.doc, .docx, .pdf, .ppt, .pptx
imagerie: :.png, .jpg, .jpeg, .tiff, .bmp, .heic
vidéo: :.mp4, .mkv, .avi, .mov
fréquence du son: :.mp3, .wav, .aac
page web: pages web dynamiques.http://.com

exemple d'utilisation

résolution des documents: :
```
python server.py --host 0.0.0.0 --port 8000 --documents
```
Cela permet de charger tous les modèles d'analyse de documents prêts à traiter les données du type de document.
analyse syntaxique multimédia: :
```
python server.py --host 0.0.0.0 --port 8000 --media
```
Le modèle Whisper est alors prêt à traiter les fichiers audio et vidéo.
robot d'exploration: :
```
python server.py --host 0.0.0.0 --port 8000 --web
```
Cela permet de mettre en place le crawler Selenium, prêt à traiter le contenu web.

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

CS50 : Assistant IA pour le cours CS50 de Harvard, ChatGPT personnalisé pour les étudiants et les enseignants

Dernières ressources sur l'IA # Outils pédagogiques AI

Il y a 12 mois

017.4K

RunDiffusion：云端运行Stable Diffusion|云端部署SD按小时计费

RunDiffusion : Exécuter la diffusion stable dans le nuage | Déployer SD dans le nuage Facturation horaire

Dernières ressources sur l'IA # AI Self-Deployment Image Generation Tool (outil de génération d'images pour l'autodéploiement de l'IA)

Il y a 12 mois

016.3K

Droxy : une solution multiplateforme de service client intelligent pour la génération de leads

Dernières ressources sur l'IA # AI Customer Service Robot

Il y a 8 mois

018.9K

Junie : l'assistant intelligent qui automatise les tâches de programmation dans l'IDE

Dernières ressources sur l'IA # Programmation AI

Il y a 6 mois

019.9K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

OmniParse : extrait des données non structurées de documents/multimédias et les analyse en données structurées.

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Utilisation de Docker

Serveur d'opérations

Types de données pris en charge

exemple d'utilisation

Océan vidéo : générez des vidéos à partir de textes ou d'images qui gardent les visages des personnes dans la file d'attente.

Smart Spectrum Clearstream : un centre d'application big model de niveau entreprise fournissant une plateforme de développement d'IA intelligente.

Articles connexes

CS50 : Assistant IA pour le cours CS50 de Harvard, ChatGPT personnalisé pour les étudiants et les enseignants

RunDiffusion : Exécuter la diffusion stable dans le nuage | Déployer SD dans le nuage Facturation horaire

Droxy : une solution multiplateforme de service client intelligent pour la génération de leads

Junie : l'assistant intelligent qui automatise les tâches de programmation dans l'IDE

Pas de commentaires

Dernières collections

Derniers articles

OmniParse : extrait des données non structurées de documents/multimédias et les analyse en données structurées.

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Utilisation de Docker

Serveur d'opérations

Types de données pris en charge

exemple d'utilisation

Océan vidéo : générez des vidéos à partir de textes ou d'images qui gardent les visages des personnes dans la file d'attente.

Smart Spectrum Clearstream : un centre d'application big model de niveau entreprise fournissant une plateforme de développement d'IA intelligente.

Articles connexes

CS50 : Assistant IA pour le cours CS50 de Harvard, ChatGPT personnalisé pour les étudiants et les enseignants

RunDiffusion : Exécuter la diffusion stable dans le nuage | Déployer SD dans le nuage Facturation horaire

Droxy : une solution multiplateforme de service client intelligent pour la génération de leads

Junie : l'assistant intelligent qui automatise les tâches de programmation dans l'IDE

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles