Allgemeine Einführung
pdf2htmlEX ist ein Open-Source-Tool entwickelt, um PDF-Dateien in das HTML-Format zu konvertieren, durch die Analyse des Inhalts der PDF-Datei und mit HTML + CSS, um genau seine visuelle Wirkung wiederherzustellen, wird das PDF-Dokument in einen Browser konvertiert werden kann direkt in der Web-Seite angezeigt werden. Das Tool eignet sich besonders für akademische Arbeiten, die eine große Anzahl von Formeln und Diagrammen enthalten, sowie für komplexe Layouts von Zeitschriften. pdf2htmlEX nutzt die Vorteile moderner Web-Technologien, um flexible Ausgabeoptionen, Unterstützung für Verlinkung, Lesezeichen, Drucken, SVG-Hintergründe und Type-3-Schriften und andere Funktionen zu bieten.
Funktionsliste
- Konvertierung von PDF-Dateien in das HTML-Format unter Beibehaltung von Text und Formatierung
- Unterstützt eine Vielzahl von Ausgabeoptionen, darunter eine einzelne HTML-Datei oder das Laden von Seiten auf Abruf
- Unterstützung für Links, Lesezeichen, Drucken, SVG-Hintergründe und Type-3-Schriften
- Bietet verbesserte DPI-Einstellungen für eine unverzerrte Grafikausgabe
- Unterstützung für transparenten Text und teilweise verdeckten Text
- Bietet einen Multiplikator für die Schriftgröße und Zoom-Optionen, um eine genaue Anzeige im Browser zu gewährleisten
- Unterstützt das Entfernen von doppelten Dateien und die Optimierung der Größe der Ausgabedatei
Hilfe verwenden
Ablauf der Installation
- Herunterladen und Installieren von Abhängigkeiten: pdf2htmlEX ist auf Tools wie Poppler und Fontforge angewiesen. Stellen Sie sicher, dass diese auf Ihrem System installiert sind.
- Laden Sie den pdf2htmlEX-Quellcode aus dem GitHub-Repository herunter:
git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
- Wechseln Sie in das heruntergeladene Verzeichnis und kompilieren Sie den Quellcode:
cd pdf2htmlEX && make
- Installieren Sie das kompilierte Programm:
sudo make install
Verwendung Prozess
- Öffnen Sie ein Terminal oder ein Befehlszeilentool.
- Verwenden Sie den folgenden Befehl, um PDF-Dateien in das HTML-Format zu konvertieren:
pdf2htmlEX Eingabe.pdf
- Die konvertierte HTML-Datei wird in demselben Verzeichnis wie die Eingabedatei gespeichert.
Detaillierte Funktionsweise
- Optionen für die UmwandlungDer Konvertierungsprozess kann mit einer Reihe von Kommandozeilenoptionen gesteuert werden, wie z.B.
--zoom
um die Skalierung der HTML-Ausgabe anzupassen.--font-size-multiplier
stellt den Multiplikator für die Schriftgröße ein. - Umgang mit unkenntlich gemachtem Text: Verwendung
--Korrekt-Text-Sichtbarkeit
behandelt vollständig oder teilweise verdeckten Text und stellt sicher, dass der Text in HTML korrekt angezeigt wird. - Optimieren der DateigrößeGröße der Ausgabedatei: Die Größe der Ausgabedatei kann optimiert werden, indem doppelte Hintergrundbilder und Schriftdateien entfernt werden, so dass die resultierende HTML-Datei kleiner und effizienter ist.