pdf2htmlEX: conversión sin pérdidas de PDF a HTML, manteniendo el formato del texto, adecuado para trabajos académicos y composición de revistas.
Últimos recursos sobre IAPublicado hace 9 meses Círculo de intercambio de inteligencia artificial 11.4K 00
Introducción general
pdf2htmlEX es una herramienta de código abierto diseñada para convertir archivos PDF a formato HTML , mediante el análisis del contenido del archivo PDF y el uso de HTML + CSS para restaurar con precisión su efecto visual , el documento PDF se convertirá en un navegador se puede ver directamente en la página web . La herramienta es especialmente adecuada para trabajos académicos que contienen un gran número de fórmulas y gráficos , así como diseños complejos de revistas . pdf2htmlEX aprovecha las tecnologías Web modernas para proporcionar opciones de salida flexibles , soporte para enlaces , marcadores , impresión , fondos SVG y fuentes de tipo 3 y otras características .
Lista de funciones
- Convierte archivos PDF a formato HTML, manteniendo intactos el texto y el formato
- Admite diversas opciones de salida, como archivos HTML individuales o carga de páginas a la carta.
- Soporte para enlaces, marcadores, impresión, fondos SVG y fuentes Type 3
- Ofrece una configuración de PPP mejorada para garantizar gráficos de salida sin distorsiones.
- Procesamiento de texto transparente y parcialmente oculto
- Proporciona un multiplicador del tamaño de la fuente y opciones de zoom para garantizar una visualización precisa en el navegador.
- Admite la eliminación de archivos duplicados y la optimización del tamaño del archivo de salida.
Utilizar la ayuda
Proceso de instalación
- Descargue e instale las dependencias: pdf2htmlEX depende de herramientas como Poppler y Fontforge, asegúrese de que están instaladas en su sistema.
- Descargue el código fuente de pdf2htmlEX del repositorio GitHub:
git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
- Vaya al directorio descargado y compile el código fuente:
cd pdf2htmlEX && make
- Instale la herramienta compilada:
sudo make install
Proceso de utilización
- Abra un terminal o una herramienta de línea de comandos.
- Utilice el siguiente comando para convertir archivos PDF a formato HTML:
pdf2htmlEX input.pdf
- El archivo HTML convertido se guardará en el mismo directorio que el archivo de entrada.
Funcionamiento detallado
- Opciones de conversiónEl proceso de conversión puede controlarse mediante una serie de opciones de línea de comandos, tales como
--zoom
para ajustar la escala del HTML de salida.--font-size-multiplier
ajusta el multiplicador del tamaño de la fuente. - Tratamiento del texto oculto: Uso
--correct-text-visibility
maneja el texto total o parcialmente oscurecido, garantizando que el texto se muestre correctamente en HTML. - Optimizar el tamaño del archivoEl tamaño del archivo de salida puede optimizarse eliminando las imágenes de fondo y los archivos de fuentes duplicados, lo que garantiza que el archivo HTML resultante sea más pequeño y eficiente.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...