PaddleOCR: 80개 이상의 언어 인식을 지원하는 플라잉 패들 기반의 다국어 OCR 툴 라이브러리입니다.

최신 AI 리소스9개월 전 업데이트 AI 공유 서클
12.4K 00

일반 소개

PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하고 데이터 주석 및 합성 도구를 제공하여 서버, 모바일 장치, 임베디드 및 IoT 장치에 대한 교육 및 배포를 지원합니다. paddleOCR은 텍스트 이미지 보정, 레이아웃 영역 감지, 일반 텍스트 감지, 스탬프 텍스트 감지, 텍스트 인식, 표 인식 및 기타 기능을 통합하여 개발 비용을 크게 절감하고 고성능 추론, 서비스 기반 배포 및 엔드사이드 배포를 지원합니다. 또한 고성능 추론, 서비스형 배포, 엔드사이드 배포를 지원합니다.

 

기능 목록

  • 다국어 인식80개 이상의 언어로 텍스트 인식이 지원됩니다.
  • 데이터 주석 및 합성 도구편리한 데이터 주석 및 합성 도구를 제공하여 학습 데이터를 빠르게 생성할 수 있도록 지원합니다.
  • 텍스트 이미지 보정텍스트 이미지 보정 기능을 통합하여 인식 정확도를 높였습니다.
  • 레이아웃 영역 감지복잡한 문서 구문 분석을 위한 고정밀 레이아웃 영역 감지 기능을 지원합니다.
  • 양식 인식테이블 인식 기능 제공, 테이블 데이터를 정확하게 추출할 수 있습니다.
  • 인감 텍스트 감지: 스탬프가 찍힌 텍스트의 감지 및 인식을 지원합니다.
  • 고성능 추론실시간 애플리케이션을 위한 고성능 추론을 지원합니다.
  • 다양한 배포 옵션서버, 모바일 디바이스, 임베디드 및 IoT 디바이스의 배포를 지원합니다.
  • 로우코드 개발로우코드 전체 프로세스 개발 도구를 제공하여 개발 문턱을 낮추고 개발 효율성을 개선합니다.

 

도움말 사용

설치 프로세스

  1. 환경 준비::
    • Python 3.6 이상이 설치되어 있는지 확인합니다.
    • 다음 명령어로 설치할 수 있는 패들패들 프레임워크를 설치합니다:
     pip install paddlepaddle
    
    • PaddleOCR을 설치합니다:
     pip install paddleocr
    
  2. 모델 다운로드::
    • 공식 리포지토리에서 사전 학습된 모델을 다운로드하고, 구체적인 다운로드 링크와 명령은 공식 문서를 참조하세요.
  3. 실행 예제::
    • 다음 명령을 사용하여 OCR 예제를 실행합니다: bash
      paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer

기능 작동 흐름

  1. 텍스트 인식::
    • 인식할 이미지 파일을 준비합니다.
    • 활용 paddleocr 명령줄 도구 또는 Python API를 사용하여 식별할 수 있습니다.
    • 샘플 코드:
     from paddleocr import PaddleOCR, draw_ocr
    import matplotlib.pyplot as plt
    import cv2
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    img_path = 'path/to/your/image.jpg'
    result = ocr.ocr(img_path, cls=True)
    for line in result:
    print(line)
    # 可视化结果
    image = cv2.imread(img_path)
    boxes = [elements[0] for elements in result]
    txts = [elements[1][0] for elements in result]
    scores = [elements[1][1] for elements in result]
    im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
    im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
    plt.imshow(im_show)
    plt.show()
    
  2. 양식 인식::
    • 양식이 포함된 이미지 파일을 준비합니다.
    • 활용 paddleocr 양식 인식을 위한 명령줄 도구 또는 Python API.
    • 샘플 코드:
     from paddleocr import PPStructure, draw_structure_result
    import cv2
    table_engine = PPStructure(show_log=True)
    img_path = 'path/to/your/table_image.jpg'
    result = table_engine(img_path)
    for line in result:
    print(line)
    # 可视化结果
    image = cv2.imread(img_path)
    im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf')
    im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
    plt.imshow(im_show)
    plt.show()
    
  3. 레이아웃 영역 감지::
    • 복잡한 레이아웃이 포함된 이미지 파일을 준비합니다.
    • 활용 paddleocr 레이아웃 영역 감지를 위한 명령줄 도구 또는 Python API.
    • 샘플 코드:
     from paddleocr import PaddleOCR, draw_ocr
    import matplotlib.pyplot as plt
    import cv2
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    img_path = 'path/to/your/layout_image.jpg'
    result = ocr.ocr(img_path, cls=True)
    for line in result:
    print(line)
    # 可视化结果
    image = cv2.imread(img_path)
    boxes = [elements[0] for elements in result]
    txts = [elements[1][0] for elements in result]
    scores = [elements[1][1] for elements in result]
    im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
    im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
    plt.imshow(im_show)
    plt.show()
    
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...