pdf2htmlEX: PDF를 HTML로 무손실 변환하여 텍스트 서식을 유지하며 학술 논문 및 잡지 조판에 적합합니다.

최신 AI 리소스9개월 전에 게시 됨 AI 공유 서클
11.3K 00

일반 소개

pdf2htmlEX는 PDF 파일을 HTML 형식으로 변환하도록 설계된 오픈 소스 도구로, PDF 파일의 내용을 분석하고 HTML + CSS를 사용하여 시각 효과를 정확하게 복원하면 PDF 문서가 브라우저로 변환되어 웹 페이지에서 직접 볼 수 있습니다. 이 도구는 특히 많은 수의 수식과 차트가 포함 된 학술 논문과 잡지의 복잡한 레이아웃에 적합합니다. pdf2htmlEX는 최신 웹 기술을 활용하여 유연한 출력 옵션, 연결, 북마크, 인쇄, SVG 배경 및 Type 3 글꼴 및 기타 기능을 지원합니다.

pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

 

기능 목록

  • 텍스트와 서식을 그대로 유지하면서 PDF 파일을 HTML 형식으로 변환하기
  • 단일 HTML 파일 또는 온디맨드 페이지 로딩을 포함한 다양한 출력 옵션 지원
  • 링크, 북마크, 인쇄, SVG 배경 및 Type 3 글꼴 지원
  • 왜곡 없는 출력 그래픽을 보장하기 위해 향상된 DPI 설정 제공
  • 투명 텍스트 및 부분적으로 가려진 텍스트 처리 지원
  • 브라우저에 정확하게 표시되도록 글꼴 크기 배율 및 확대/축소 옵션을 제공합니다.
  • 중복 파일 제거 및 출력 파일 크기 최적화 지원

 

도움말 사용

설치 프로세스

  1. 종속성 다운로드 및 설치: pdf2htmlEX는 Poppler 및 Fontforge와 같은 도구에 의존하므로 시스템에 해당 도구가 설치되어 있는지 확인하세요.
  2. GitHub 리포지토리에서 pdf2htmlEX 소스 코드를 다운로드하세요:git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
  3. 다운로드한 디렉토리로 이동하여 소스 코드를 컴파일합니다:cd pdf2htmlEX && make
  4. 컴파일된 도구를 설치합니다:sudo make install

사용 프로세스

  1. 터미널 또는 명령줄 도구를 엽니다.
  2. 다음 명령을 사용하여 PDF 파일을 HTML 형식으로 변환합니다:pdf2htmlEX input.pdf
  3. 변환된 HTML 파일은 입력 파일과 같은 디렉터리에 저장됩니다.

세부 기능 작동

  • 전환 옵션다음과 같은 다양한 명령줄 옵션을 사용하여 변환 프로세스를 제어할 수 있습니다. --zoom 옵션을 사용하여 출력 HTML의 배율을 조정할 수 있습니다.--font-size-multiplier 옵션은 글꼴 크기 배율을 조정합니다.
  • 가려진 텍스트 처리사용 --correct-text-visibility 옵션은 전체 또는 부분적으로 가려진 텍스트를 처리하여 텍스트가 HTML로 올바르게 표시되도록 합니다.
  • 파일 크기 최적화중복된 배경 이미지와 글꼴 파일을 제거하여 출력 파일의 크기를 최적화하여 결과 HTML 파일을 더 작고 효율적으로 만들 수 있습니다.
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...