AI Personal Learning
und praktische Anleitung
豆包Marscode1

pdf2htmlEX: Verlustfreie Konvertierung von PDF in HTML unter Beibehaltung der Textformatierung, geeignet für wissenschaftliche Arbeiten und Magazinsatz

Allgemeine Einführung

pdf2htmlEX ist ein Open-Source-Tool, das entwickelt wurde, um PDF-Dateien in das HTML-Format zu konvertieren. Durch die Analyse des Inhalts der PDF-Datei und die Verwendung von HTML + CSS, um die visuelle Wirkung genau wiederherzustellen, wird das PDF-Dokument in einen Browser umgewandelt und kann direkt auf der Webseite angezeigt werden. Das Tool eignet sich besonders für akademische Arbeiten, die eine große Anzahl von Formeln und Diagrammen enthalten, sowie für komplexe Layouts von Zeitschriften. pdf2htmlEX nutzt die Vorteile moderner Web-Technologien, um flexible Ausgabeoptionen, Unterstützung für Verlinkung, Lesezeichen, Drucken, SVG-Hintergründe und Type-3-Schriften und andere Funktionen zu bieten.

pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版-1

 

Funktionsliste

  • Konvertierung von PDF-Dateien in das HTML-Format unter Beibehaltung von Text und Formatierung
  • Unterstützt eine Vielzahl von Ausgabeoptionen, darunter eine einzelne HTML-Datei oder das Laden von Seiten auf Abruf
  • Unterstützung für Links, Lesezeichen, Drucken, SVG-Hintergründe und Type-3-Schriften
  • Bietet verbesserte DPI-Einstellungen für eine unverzerrte Grafikausgabe
  • Unterstützung für transparenten Text und teilweise verdeckten Text
  • Bietet einen Multiplikator für die Schriftgröße und Zoom-Optionen, um eine genaue Anzeige im Browser zu gewährleisten
  • Unterstützt das Entfernen von doppelten Dateien und die Optimierung der Größe der Ausgabedatei

 

Hilfe verwenden

Einbauverfahren

  1. Herunterladen und Installieren von Abhängigkeiten: pdf2htmlEX ist auf Tools wie Poppler und Fontforge angewiesen. Bitte stellen Sie sicher, dass diese auf Ihrem System installiert sind.
  2. Laden Sie den pdf2htmlEX-Quellcode aus dem GitHub-Repository herunter:git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
  3. Wechseln Sie in das heruntergeladene Verzeichnis und kompilieren Sie den Quellcode:cd pdf2htmlEX && make
  4. Installieren Sie das kompilierte Programm:sudo make install

Verwendungsprozess

  1. Öffnen Sie ein Terminal oder ein Befehlszeilentool.
  2. Verwenden Sie den folgenden Befehl, um PDF-Dateien in das HTML-Format zu konvertieren:pdf2htmlEX input.pdf
  3. Die konvertierte HTML-Datei wird in demselben Verzeichnis wie die Eingabedatei gespeichert.

Detaillierte Funktionsweise

  • Optionen für die UmwandlungDer Konvertierungsprozess kann mit einer Reihe von Kommandozeilenoptionen gesteuert werden, wie z.B. --zoom um die Skalierung der HTML-Ausgabe anzupassen.--font-size-multiplier stellt den Multiplikator für die Schriftgröße ein.
  • Umgang mit unkenntlich gemachtem Text: Verwendung --correct-text-visibility behandelt vollständig oder teilweise verdeckten Text und stellt sicher, dass der Text in HTML korrekt angezeigt wird.
  • Optimieren der DateigrößeGröße der Ausgabedatei: Die Größe der Ausgabedatei kann optimiert werden, indem doppelte Hintergrundbilder und Schriftdateien entfernt werden, so dass die resultierende HTML-Datei kleiner und effizienter ist.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " pdf2htmlEX: Verlustfreie Konvertierung von PDF in HTML unter Beibehaltung der Textformatierung, geeignet für wissenschaftliche Arbeiten und Magazinsatz
de_DEDeutsch