pdf2htmlEX: conversión sin pérdidas de PDF a HTML, manteniendo el formato del texto, adecuado para trabajos académicos y composición de revistas.
Últimos recursos sobre IAPublicado hace 10 meses Círculo de intercambio de inteligencia artificial 18.5K 00
Introducción general
pdf2htmlEX es una herramienta de código abierto diseñada para convertir archivos PDF a formato HTML , mediante el análisis del contenido del archivo PDF y el uso de HTML + CSS para restaurar con precisión su efecto visual , el documento PDF se convertirá en un navegador se puede ver directamente en la página web . La herramienta es especialmente adecuada para trabajos académicos que contienen un gran número de fórmulas y gráficos , así como diseños complejos de revistas . pdf2htmlEX aprovecha las tecnologías Web modernas para proporcionar opciones de salida flexibles , soporte para enlaces , marcadores , impresión , fondos SVG y fuentes de tipo 3 y otras características .
Lista de funciones
- Convierte archivos PDF a formato HTML, manteniendo intactos el texto y el formato
- Admite diversas opciones de salida, como archivos HTML individuales o carga de páginas a la carta.
- Soporte para enlaces, marcadores, impresión, fondos SVG y fuentes Type 3
- Ofrece una configuración de PPP mejorada para garantizar gráficos de salida sin distorsiones.
- Procesamiento de texto transparente y parcialmente oculto
- Proporciona un multiplicador del tamaño de la fuente y opciones de zoom para garantizar una visualización precisa en el navegador.
- Admite la eliminación de archivos duplicados y la optimización del tamaño del archivo de salida.
Utilizar la ayuda
Proceso de instalación
- Descargue e instale las dependencias: pdf2htmlEX depende de herramientas como Poppler y Fontforge, asegúrese de que están instaladas en su sistema.
- Descargue el código fuente de pdf2htmlEX del repositorio GitHub:
git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
- Vaya al directorio descargado y compile el código fuente:
cd pdf2htmlEX && make
- Instale la herramienta compilada:
sudo make install
Proceso de utilización
- Abra un terminal o una herramienta de línea de comandos.
- Utilice el siguiente comando para convertir archivos PDF a formato HTML:
pdf2htmlEX input.pdf
- El archivo HTML convertido se guardará en el mismo directorio que el archivo de entrada.
Funcionamiento detallado
- Opciones de conversiónEl proceso de conversión puede controlarse mediante una serie de opciones de línea de comandos, tales como
--zoom
para ajustar la escala del HTML de salida.--font-size-multiplier
ajusta el multiplicador del tamaño de la fuente. - Tratamiento del texto oculto: Uso
--correct-text-visibility
maneja el texto total o parcialmente oscurecido, garantizando que el texto se muestre correctamente en HTML. - Optimizar el tamaño del archivoEl tamaño del archivo de salida puede optimizarse eliminando las imágenes de fondo y los archivos de fuentes duplicados, lo que garantiza que el archivo HTML resultante sea más pequeño y eficiente.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Puestos relacionados
Sin comentarios...