Dolphin - Grand modèle d'analyse légère de documents Wordpress open source

Qu'est-ce que le dauphin ?

Dolphin est un modèle d'analyse de documents léger, open source, avec 322 millions de paramètres, une petite taille et une vitesse d'exécution rapide. Le modèle est basé sur une approche d'analyse syntaxique en deux étapes, basée sur l'analyse de la mise en page pour identifier les éléments du document (tels que les titres, les tableaux, les formules, etc.), puis chaque élément du contenu de l'analyse, le modèle prend en charge l'extraction du texte, des formules, des tableaux et d'autres éléments, la prise en charge de la sortie de JSON, Markdown, le format HTML, etc. Dolphin s'applique à la recherche universitaire, aux bureaux commerciaux, à l'éducation, au développement technologique et à d'autres domaines. Dolphin convient à la recherche universitaire, aux bureaux commerciaux, à l'éducation, au développement technologique, etc. Dolphin peut traiter efficacement les documents universitaires, les rapports commerciaux, les documents techniques, etc., aider à numériser les documents et à extraire des informations, et améliorer l'efficacité du bureau.

Dolphin - 字节跳动开源的轻量级文档解析大模型

Principales caractéristiques de Dolphin

  • Analyse de la mise en pageIdentifie avec précision les titres, graphiques, tableaux, notes de bas de page et autres éléments d'un document, et génère une séquence claire d'éléments basée sur l'ordre de lecture naturel, jetant ainsi les bases d'une analyse ultérieure du contenu.
  • extraction de contenuLe logiciel d'analyse de documents : Il analyse les pages de documents en format JSON ou Markdown structuré en vue d'un traitement et d'une présentation ultérieurs.
  • analyse de texteLe logiciel est conçu pour extraire avec précision le contenu textuel des documents, en chinois, en anglais et dans de nombreuses autres langues.
  • reconnaissance de la formuleIl permet la reconnaissance de formules complexes en ligne et en bloc, et produit des sorties au format LaTeX pour faciliter la manipulation de documents académiques et techniques.
  • analyse du tableauPrise en charge de l'analyse de structures de tableaux complexes et de l'extraction du contenu des cellules pour générer des tableaux au format HTML afin de répondre aux besoins d'un grand nombre de scénarios d'application.
  • Architecture légèreCe modèle, dont le numéro de référence est 322M, est petit et rapide, et convient à une utilisation dans des appareils ou des environnements à ressources limitées.
  • Entrées et sorties multiplesLes résultats de l'analyse peuvent être restitués dans les formats JSON, Markdown, HTML et autres, ce qui est pratique pour l'intégration dans différents systèmes.

Adresse du site web officiel de Dolphin

Comment utiliser Dolphin

  • Démonstration de l'expérience en ligneEn visitant l'adresse de démonstration de l'expérience en ligne Dolphin, l'utilisateur télécharge directement les images des documents pour les analyser, sans avoir besoin d'installer ou de configurer un quelconque environnement.
  • Déploiement du dépôt GitHub: :
    • entrepôt de clones: :
git clone https://github.com/bytedance/Dolphin.git
cd Dolphin
    • Installation des dépendances: :
pip install -r requirements.txt
    • Télécharger le modèle pré-entraînéTéléchargez et décompressez les fichiers du modèle pré-entraîné en suivant les instructions du dépôt GitHub.
    • code en cours d'exécutionLancer Dolphin en suivant le code d'exemple dans le référentiel. par exemple :
from dolphin import DolphinParser

parser = DolphinParser(model_path="path/to/model")
result = parser.parse(image_path="path/to/document.jpg")
print(result)
  • Bibliothèque de modèles de visages étreints: :
    • Installation de la bibliothèque Hugging Face: :
pip install transformers
    • Modèles de chargement: :
from transformers import AutoModelForDocumentParsing, AutoFeatureExtractor

model_name = "ByteDance/Dolphin"
model = AutoModelForDocumentParsing.from_pretrained(model_name)
feature_extractor = AutoFeatureExtractor.from_pretrained(model_name)

# 加载文档图像并进行预处理
image = feature_extractor(images="path/to/document.jpg", return_tensors="pt")

# 进行解析
outputs = model(**image)
# 处理输出结果
    • Traitement des résultats de sortieTraitement et utilisation ultérieurs des résultats de l'analyse syntaxique en fonction du format de sortie du modèle (par exemple, JSON, HTML, etc.).

Les points forts de Dolphin

  • Léger et efficaceDolphin ne pèse que 322 Mo, il est petit et rapide et convient aux environnements à ressources limitées.
  • Approche de l'analyse syntaxique en deux étapesParsing : Analyse de la mise en page avant le contenu, basée sur le traitement parallèle pour améliorer l'efficacité et la précision.
  • Analyse puissante des documentsLe logiciel d'analyse de documents : Il permet d'analyser du texte, des tableaux, des formules, des graphiques et d'autres éléments afin de couvrir des structures de documents complexes.
  • Prise en charge multilingueLes logiciels de traitement de texte : Identifier avec précision les textes en chinois, en anglais et dans d'autres langues pour répondre aux besoins du traitement de documents multilingues.
  • Diverses entrées et sortiesCompatible avec une variété de formats de documents en entrée, prise en charge de JSON, Markdown, HTML et d'autres formats en sortie, facile à intégrer.
  • Source ouverte et facilité d'utilisationLe code et les modèles pré-entraînés sont libres et fournissent de riches ressources aux développeurs pour leur permettre de démarrer rapidement et de personnaliser leur développement.
  • Haute performanceIl surpasse les modèles classiques tels que GPT-4.1 et Mistral-OCR dans les tâches d'analyse syntaxique des documents et excelle dans la reconnaissance des tableaux et des formules.

À qui s'adresse Dolphin

  • chercheurLe logiciel d'analyse de la littérature : analyse rapidement le texte, les formules et les diagrammes dans les articles académiques, aidant les chercheurs à organiser efficacement la littérature et à extraire des informations clés pour accélérer leur travail scientifique.
  • Personnel du siègeLes entreprises extraient des informations clés des contrats, des rapports et d'autres documents commerciaux afin de faciliter la révision des contrats et la création de rapports et d'améliorer l'efficacité du travail de bureau.
  • éducateurLes enseignants et les établissements d'enseignement utilisent Dolphin pour numériser le matériel pédagogique et les copies d'examen, soutenir l'enseignement en ligne et le multilinguisme, et enrichir les ressources pédagogiques.
  • Développeur technologiqueLes développeurs analysent la documentation technique pour faciliter la gestion du code et les échanges techniques, ainsi que le développement secondaire et la personnalisation sur la base du code source ouvert.
  • écoliersLes étudiants organisent rapidement leur matériel d'étude et en extraient les points clés pour faciliter l'apprentissage et la révision.
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...