Allgemeine Einführung
PPTX2MD ist ein Open-Source-Tool, das PowerPoint PPTX-Dateien in das Markdown-Format konvertiert. Entwickelt von GitHub-Benutzer ssine, unterstützt das Tool die Beibehaltung von Überschriften, Listen, Textformatierungen (wie fett, kursiv, Farben und Hyperlinks), Bilder und Tabellen in einer Vielzahl von Formaten.PPTX2MD unterstützt auch benutzerdefinierte Inhaltsverzeichnisse, Fuzzy-Matching und eine Vielzahl von Ausgabeformaten wie Markdown, Tiddlywiki's wikitext, Madoko und Benutzer müssen nur Python 3.10 und höher installieren und pptx2md über pip installieren, um PPTX-Dateien in das Markdown-Format zu konvertieren, das in verschiedenen Markdown-Editoren verwendet werden kann.
Funktionsliste
- PPTX-Dateien in das Markdown-Format konvertieren
- Unterstützung für die Beibehaltung von Überschriften, Listen, Textformatierung (fett, kursiv, Farbe und Hyperlinks)
- Unterstützung der Bildextraktion und des Einfügens von relativen Pfaden
- Unterstützung der Tabellenkonvertierung, einschließlich der Zusammenführung von Zellen
- Unterstützung für benutzerdefinierte Kataloge und Fuzzy Matching
- Mehrere Ausgabeformate werden unterstützt: Markdown, Tiddlywikis wikitext, Madoko, Quarto
- Bietet eine Vielzahl von Befehlszeilenparametern, unterstützt benutzerdefinierte Ausgabedateipfade, Bildverzeichnisse, Bildbreiten, etc.
Hilfe verwenden
Einbauverfahren
- Stellen Sie sicher, dass Python 3.10 oder höher auf Ihrem System installiert ist.
- Öffnen Sie ein Terminal oder eine Eingabeaufforderung und führen Sie den folgenden Befehl aus, um pptx2md zu installieren:
pip install pptx2md
Verwendung
- Nach Abschluss der Installation führen Sie den folgenden Befehl im Terminal oder in der Eingabeaufforderung aus, um PPTX-Dateien in das Markdown-Format zu konvertieren:
pptx2md [pptx文件名]
Der Standardname der Ausgabedatei istout.md
Die extrahierten Bilder werden in der Datei/img/
Ordner.
Detaillierte Funktionsweise
- Benutzerdefinierter TitelStandardmäßig parst das Tool alle PPTX-Überschriften als eine Ebene von Markdown-Überschriften. Wenn Sie einen hierarchischen Katalog benötigen, können Sie die Liste der Überschriften in der Datei vordefinieren und die Funktion
-t
Parameter, um die Datei bereitzustellen. Beispiel:
pptx2md [文件名] -t titles.txt
Beispiel für eine Titeldatei (titles.txt):
Heading 1
Heading 1.1
Heading 1.1.1
Heading 1.2
- Anpassen des Pfads der Ausgabedatei: Verwendung
-o
Parameter gibt den Pfad der Ausgabedatei an:
pptx2md [文件名] -o [输出文件路径]
- Benutzerdefinierte Bildkataloge: Verwendung
-i
Parameter gibt das Verzeichnis für die Bildextraktion an:
pptx2md [文件名] -i [图片目录]
- Einstellung der Bildbreite: Verwendung
--image-width
legt die maximale Breite des Bildes (in Pixel) fest:
pptx2md [文件名] --image-width [宽度]
- Bildextraktion deaktivieren: Verwendung
--disable-image
Parameter deaktiviert die Bildextraktion:
pptx2md [文件名] --disable-image
- Sonderzeichen-Escaping deaktivieren: Verwendung
--disable-escaping
Parameter deaktiviert das Escaping von Sonderzeichen:
pptx2md [文件名] --disable-escaping
- Bemerkungen des Moderators deaktivieren: Verwendung
--disable-notes
Die Parameter deaktivieren die Notizen des Moderators:
pptx2md [文件名] --disable-notes
- Deaktivieren der Bildverarbeitung im WMF-Format: Verwendung
--disable-wmf
Parameter deaktiviert die Verarbeitung von Bildern im WMF-Format (um Ausnahmen unter Linux zu vermeiden):
pptx2md [文件名] --disable-wmf
- Farbetiketten deaktivieren: Verwendung
--disable-color
Parameter deaktiviert die HTML-Farb-Tags:
pptx2md [文件名] --disable-color
- Aktivieren von Trennfolien: Verwendung
--enable-slides
Parameter Folientrenner aktivieren (für die Konvertierung von PPTX-Folien in Markdown-Folien):
pptx2md [文件名] --enable-slides
- Versuch, mehrspaltige Folien zu erkennen: Verwendung
--try-multi-column
Der Parameter versucht, mehrere Spalten von Dias zu erkennen (langsamer):
pptx2md [文件名] --try-multi-column
- Einstellung der Mindestgröße des Textblocks: Verwendung
--min-block-size
legt die Mindestanzahl der Zeichen für den Ausgabetextblock fest:
pptx2md [文件名] --min-block-size [大小]
- Export in das Tiddlywiki- oder Madoko-Format: Verwendung
--wiki
vielleicht--mdk
gibt die entsprechende Auszeichnungssprache aus:
pptx2md [文件名] --wiki
pptx2md [文件名] --mdk