Pix2Text: 오픈 소스 무료 이미지 텍스트 인식 도구

Pix2Text 일반 소개

Pix2Text(P2T)는 이미지 텍스트와 수학 공식 인식을 제공하는 Mathpix를 대체하기 위해 설계된 오픈 소스 무료 도구입니다. 사용자는 웹 버전을 통해 무료로 이 도구를 사용할 수 있으며, 하루에 최대 10,000자까지 인식할 수 있습니다. P2T는 이미지의 텍스트, 표, 수학 공식 등을 인식하고 LaTeX 또는 마크다운 형식으로 변환하여 쉽게 편집하고 사용할 수 있도록 지원합니다.

 

Pix2Text:开源免费图片文字识别工具

 

 

Pix2Text 기능 목록

  • 이미지 텍스트 인식: 이미지의 중국어 및 영어 텍스트를 인식하여 편집 가능한 텍스트로 변환합니다.
  • 수학 공식 인식: 이미지에서 수학 공식을 인식하고 이를 LaTeX 표현으로 변환합니다.
  • 표 인식: 이미지에서 표를 인식하여 마크다운 형식으로 변환합니다.
  • PDF 변환: PDF 파일의 내용을 마크다운 형식으로 변환합니다.
  • 무료 사용: 하루 최대 10,000자.

 

Pix2Text 도움말

설치 및 사용

Pix2Text는 사용자가 소프트웨어를 설치할 필요가 없는 웹 기반 버전으로 제공됩니다. 다음 사이트를 방문하세요. Pix2Text 웹사이트 를 클릭하고 인식이 필요한 이미지나 PDF 파일을 업로드하면 인식 결과를 확인할 수 있습니다.

기능 작동 흐름

  1. 웹사이트에 액세스브라우저를 열고 다음을 방문하세요. Pix2Text 웹사이트.
  2. 파일 업로드페이지에서 '파일 업로드' 버튼을 클릭하고 인식할 이미지 또는 PDF 파일을 선택합니다.
  3. 식별 유형 선택필요에 따라 텍스트, 수학 공식 또는 표를 인식하도록 선택합니다.
  4. 결과 보기'인식 시작' 버튼을 클릭하고 인식 결과가 표시될 때까지 몇 초간 기다립니다.
  5. 결과 다운로드인식 결과를 LaTeX 또는 마크다운 파일로 직접 복사하거나 다운로드할 수 있습니다.

 

세부 기능

  • 이미지 텍스트 인식다양한 문서, 책, 손글씨 메모 및 기타 이미지에 대한 중국어 및 영어 텍스트 인식을 지원합니다.
  • 수학 공식 인식고급 수학 공식 감지 및 인식 모델은 사진 속 수학 공식을 정확하게 식별하고 이를 LaTeX 표현으로 변환할 수 있어 학술 연구 및 논문 작성에 편리합니다.
  • 양식 인식이미지의 표 구조를 인식하고 문서에서 쉽게 사용할 수 있도록 마크다운 형식으로 변환합니다.
  • PDF 변환PDF 콘텐츠를 편집하고 정리해야 하는 사용자를 위해 PDF 파일을 마크다운 형식으로 변환하세요.
  • 무료 사용Pix2Text는 무료로 사용할 수 있으며 하루에 최대 10,000자를 인식할 수 있어 개인 및 소규모 팀에 적합합니다.

 

팁 및 유용한 정보

  • 고품질 이미지선명한 이미지를 업로드하면 인식 정확도를 높일 수 있습니다.
  • 세그먼트 식별긴 문서의 경우 이미지를 세그먼트 단위로 업로드하여 각 세그먼트가 정확하게 인식되도록 할 수 있습니다.
  • 검사 결과인식 결과에는 소수의 오류가 포함될 수 있으며, 사용자는 사용하기 전에 이를 확인하고 교정하는 것이 좋습니다.

 

 

Pix2Text 프로젝트 배포

마운팅

  1. 오픈 소스 주소:https://github.com/breezedeus/Pix2Text
  2. Python 환경 준비파이썬 3.6 이상이 설치되어 있는지 확인합니다.
  3. Pix2Text 설치::
    pip install pix2text
    

    다국어 텍스트를 인식해야 하는 경우 다음 명령을 사용하여 추가 패키지를 설치하세요:

    pip install pix2text[multilingual]
    

    설치 속도가 느린 경우 AliCloud 설치 소스를 사용하는 등 국내 설치 소스를 지정할 수 있습니다:

    pip install pix2text -i https://mirrors.aliyun.com/pypi/simple
    

     

활용

  1. 명령줄 도구::
    • 사진 속 텍스트를 인식합니다:
      pix2text image.jpg
      

       

    • PDF 파일을 인식합니다:
      pix2text document.pdf
      

       

  2. HTTP 서비스::
    • HTTP 서비스를 시작합니다:
      pix2text serve
      

       

    • HTTP 요청을 통해 이미지를 인식합니다:
      curl -F "file=@image.jpg" http://localhost:5000/ocr
      

       

  3. 웹 버전 사용::
    • 웹사이트의 Pix2Text 온라인 버전을 방문하여 이미지를 지정된 영역에 끌어다 놓으면 인식 결과를 확인할 수 있습니다.

일반적인 예

  • 이미지 텍스트 인식입력 이미지: !example 출력 텍스트:
    这是一个示例文本。
    

     

  • 수학 공식 인식입력 그림: !.example 출력 공식:
    $$E=mc^2$$
    

     

  • 양식 인식입력 이미지: !example 출력 테이블:
    | Header1 | Header2 |
    |---------|---------|
    | Data1   | Data2   |
    
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...