pdf2htmlEX : conversion sans perte de PDF en HTML, en conservant le formatage du texte, adapté aux travaux universitaires et à la composition de magazines.
Introduction générale
pdf2htmlEX est un outil open source conçu pour convertir les fichiers PDF au format HTML, en analysant le contenu du fichier PDF et en utilisant HTML + CSS pour restaurer avec précision son effet visuel, le document PDF sera converti dans un navigateur pour être visualisé directement sur la page Web. L'outil est particulièrement adapté aux documents académiques contenant un grand nombre de formules et de graphiques, ainsi qu'aux mises en page complexes de magazines. pdf2htmlEX tire parti des technologies Web modernes pour fournir des options de sortie flexibles, la prise en charge des liens, des signets, de l'impression, des arrière-plans SVG et des polices de type 3, ainsi que d'autres fonctionnalités.
Liste des fonctions
- Convertir les fichiers PDF au format HTML, en conservant le texte et la mise en forme intacts
- Prise en charge d'une variété d'options de sortie, y compris un fichier HTML unique ou le chargement de pages à la demande.
- Prise en charge des liens, des signets, de l'impression, des arrière-plans SVG et des polices de type 3
- Fournit des paramètres DPI améliorés pour garantir des graphiques de sortie non déformés.
- Prise en charge du traitement des textes transparents et des textes partiellement masqués
- Fournit un multiplicateur de taille de police et des options de zoom pour garantir un affichage précis dans le navigateur.
- Suppression des fichiers en double et optimisation de la taille des fichiers de sortie
Utiliser l'aide
Processus d'installation
- Télécharger et installer les dépendances : pdf2htmlEX s'appuie sur des outils tels que Poppler et Fontforge, veuillez vous assurer qu'ils sont installés sur votre système.
- Téléchargez le code source de pdf2htmlEX depuis le dépôt GitHub :
git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
- Allez dans le répertoire téléchargé et compilez le code source :
cd pdf2htmlEX && make
- Installer l'outil compilé :
sudo make install
Processus d'utilisation
- Ouvrez un terminal ou un outil de ligne de commande.
- Utilisez la commande suivante pour convertir les fichiers PDF au format HTML :
pdf2htmlEX input.pdf
- Le fichier HTML converti sera enregistré dans le même répertoire que le fichier d'entrée.
Fonctionnement détaillé
- Options de conversionLe processus de conversion peut être contrôlé à l'aide d'une série d'options de ligne de commande, telles que
--zoom
pour ajuster la mise à l'échelle de la sortie HTML.--font-size-multiplier
permet d'ajuster le multiplicateur de la taille de la police. - Traitement du texte obscurci: Utilisation
--correct-text-visibility
gère le texte totalement ou partiellement obscurci, en veillant à ce que le texte s'affiche correctement en HTML. - Optimiser la taille des fichiersLa taille du fichier de sortie peut être optimisée en supprimant les images d'arrière-plan et les fichiers de police en double, ce qui permet d'obtenir un fichier HTML plus petit et plus efficace.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...