Introdução geral
O PPTX2MD é uma ferramenta de código aberto projetada para converter arquivos PPTX do PowerPoint para o formato Markdown. Desenvolvida pelo usuário ssine do GitHub, a ferramenta suporta a retenção de cabeçalhos, listas, formatação de texto (como negrito, itálico, cor e hiperlinks), imagens e tabelas, entre outros. O PPTX2MD também suporta índices personalizados, correspondência difusa e uma variedade de formatos de saída, como Markdown, wikitext do Tiddlywiki, Madoko e Quarto. Os usuários só precisam instalar o Python 3.10 ou superior e instalar o pptx2md via pip para converter facilmente arquivos PPTX para o formato Markdown para facilitar o uso em vários editores Markdown.
Lista de funções
- Converta arquivos PPTX para o formato Markdown
- Suporte para manter títulos, listas, formatação de texto (negrito, itálico, cor e hiperlinks)
- Suporte à extração de imagens e inserção de caminhos relativos
- Suporte à conversão de tabelas, incluindo a fusão de células
- Suporte para diretórios personalizados e correspondência difusa
- Suporte a vários formatos de saída: Markdown, wikitext do Tiddlywiki, Madoko, Quarto
- Fornece uma variedade de parâmetros de linha de comando, suporte para caminho de arquivo de saída personalizado, diretório de imagem, largura da imagem etc.
Usando a Ajuda
Processo de instalação
- Certifique-se de que o Python 3.10 ou superior esteja instalado em seu sistema.
- Abra um terminal ou prompt de comando e execute o seguinte comando para instalar o pptx2md:
pip install pptx2md
Uso
- Após a conclusão da instalação, execute o seguinte comando no terminal ou no prompt de comando para converter arquivos PPTX para o formato Markdown:
pptx2md [nome do arquivo pptx]
O nome padrão do arquivo de saída éout.md
As imagens extraídas serão salvas no arquivo/img/
pasta.
Operação detalhada da função
- Título personalizadoPor padrão, a ferramenta analisa todos os cabeçalhos PPTX como um nível de cabeçalhos Markdown. Se precisar obter um catálogo hierárquico, você pode predefinir a lista de títulos no arquivo e usar a função
-t
para fornecer o arquivo. Exemplo:
pptx2md [nome do arquivo] -t titles.txt
Exemplo de um arquivo de títulos (titles.txt):
Título 1
Título 1.1
Título 1.1.1
Título 1.2
- Personalização do caminho do arquivo de saída: Uso
-o
especifica o caminho do arquivo de saída:
pptx2md [nome do arquivo] -o [caminho do arquivo de saída]
- Catálogos de imagens personalizados: Uso
-i
especifica o diretório de extração da imagem:
pptx2md [nome do arquivo] -i [diretório da imagem]
- Definição da largura da imagem: Uso
--image-width
define a largura máxima da imagem (em pixels):
pptx2md [nome do arquivo] --image-width [largura]
- Desativar a extração de imagens: Uso
--disable-image
desativa a extração de imagens:
pptx2md [nome do arquivo] --disable-image
- Desativar o escape de caracteres especiais: Uso
--disable-escaping
desativa o escape de caracteres especiais:
pptx2md [nome do arquivo] --disable-escaping
- Desativar observações do apresentador: Uso
--disable-notes
Os parâmetros desativam as anotações do apresentador:
pptx2md [nome do arquivo] --disable-notes
- Desativar o processamento de imagens no formato WMF: Uso
--disable-wmf
desativa o processamento de imagens no formato WMF (para evitar exceções no Linux):
pptx2md [nome do arquivo] --disable-wmf
- Desativar rótulos coloridos: Uso
--disable-colour
desativa as tags de cor HTML:
pptx2md [nome do arquivo] --disable-colour
- Ativação de separadores de slides: Uso
--enable-slides
Parâmetro Habilitar separadores de slides (para converter slides PPTX em slides Markdown):
pptx2md [nome do arquivo] --enable-slides
- Tentando detectar slides com várias colunas: Uso
---try-multi-column
O parâmetro tenta detectar várias colunas de slides (mais lento):
pptx2md [nome do arquivo] --try-multi-column
- Definição do tamanho mínimo do bloco de texto: Uso
--min-block-size
define o número mínimo de caracteres para o bloco de texto de saída:
pptx2md [nome do arquivo] --min-block-size [tamanho]
- Exportar para o formato Tiddlywiki ou Madoko: Uso
--wiki
talvez---mdk
gera a linguagem de marcação correspondente:
pptx2md [nome do arquivo] --wiki
pptx2md [nome do arquivo] --mdk