pdf2htmlEX : conversion sans perte de PDF en HTML, en conservant le formatage du texte, adapté aux travaux universitaires et à la composition de magazines.

Introduction générale

pdf2htmlEX est un outil open source conçu pour convertir les fichiers PDF au format HTML, en analysant le contenu du fichier PDF et en utilisant HTML + CSS pour restaurer avec précision son effet visuel, le document PDF sera converti dans un navigateur pour être visualisé directement sur la page Web. L'outil est particulièrement adapté aux documents académiques contenant un grand nombre de formules et de graphiques, ainsi qu'aux mises en page complexes de magazines. pdf2htmlEX tire parti des technologies Web modernes pour fournir des options de sortie flexibles, la prise en charge des liens, des signets, de l'impression, des arrière-plans SVG et des polices de type 3, ainsi que d'autres fonctionnalités.

pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

 

Liste des fonctions

  • Convertir les fichiers PDF au format HTML, en conservant le texte et la mise en forme intacts
  • Prise en charge d'une variété d'options de sortie, y compris un fichier HTML unique ou le chargement de pages à la demande.
  • Prise en charge des liens, des signets, de l'impression, des arrière-plans SVG et des polices de type 3
  • Fournit des paramètres DPI améliorés pour garantir des graphiques de sortie non déformés.
  • Prise en charge du traitement des textes transparents et des textes partiellement masqués
  • Fournit un multiplicateur de taille de police et des options de zoom pour garantir un affichage précis dans le navigateur.
  • Suppression des fichiers en double et optimisation de la taille des fichiers de sortie

 

Utiliser l'aide

Processus d'installation

  1. Télécharger et installer les dépendances : pdf2htmlEX s'appuie sur des outils tels que Poppler et Fontforge, veuillez vous assurer qu'ils sont installés sur votre système.
  2. Téléchargez le code source de pdf2htmlEX depuis le dépôt GitHub :git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
  3. Allez dans le répertoire téléchargé et compilez le code source :cd pdf2htmlEX && make
  4. Installer l'outil compilé :sudo make install

Processus d'utilisation

  1. Ouvrez un terminal ou un outil de ligne de commande.
  2. Utilisez la commande suivante pour convertir les fichiers PDF au format HTML :pdf2htmlEX input.pdf
  3. Le fichier HTML converti sera enregistré dans le même répertoire que le fichier d'entrée.

Fonctionnement détaillé

  • Options de conversionLe processus de conversion peut être contrôlé à l'aide d'une série d'options de ligne de commande, telles que --zoom pour ajuster la mise à l'échelle de la sortie HTML.--font-size-multiplier permet d'ajuster le multiplicateur de la taille de la police.
  • Traitement du texte obscurci: Utilisation --correct-text-visibility gère le texte totalement ou partiellement obscurci, en veillant à ce que le texte s'affiche correctement en HTML.
  • Optimiser la taille des fichiersLa taille du fichier de sortie peut être optimisée en supprimant les images d'arrière-plan et les fichiers de police en double, ce qui permet d'obtenir un fichier HTML plus petit et plus efficace.
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...