PaddleOCR: 80개 이상의 언어 인식을 지원하는 플라잉 패들 기반의 다국어 OCR 툴 라이브러리입니다.

일반 소개

PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하고 데이터 주석 및 합성 도구를 제공하여 서버, 모바일 장치, 임베디드 및 IoT 장치에 대한 교육 및 배포를 지원합니다. paddleOCR은 텍스트 이미지 보정, 레이아웃 영역 감지, 일반 텍스트 감지, 스탬프 텍스트 감지, 텍스트 인식, 표 인식 및 기타 기능을 통합하여 개발 비용을 크게 절감하고 고성능 추론, 서비스 기반 배포 및 엔드사이드 배포를 지원합니다. 또한 고성능 추론, 서비스형 배포, 엔드사이드 배포를 지원합니다.

기능 목록

다국어 인식80개 이상의 언어로 텍스트 인식이 지원됩니다.
데이터 주석 및 합성 도구편리한 데이터 주석 및 합성 도구를 제공하여 학습 데이터를 빠르게 생성할 수 있도록 지원합니다.
텍스트 이미지 보정텍스트 이미지 보정 기능을 통합하여 인식 정확도를 높였습니다.
레이아웃 영역 감지복잡한 문서 구문 분석을 위한 고정밀 레이아웃 영역 감지 기능을 지원합니다.
양식 인식테이블 인식 기능 제공, 테이블 데이터를 정확하게 추출할 수 있습니다.
인감 텍스트 감지: 스탬프가 찍힌 텍스트의 감지 및 인식을 지원합니다.
고성능 추론실시간 애플리케이션을 위한 고성능 추론을 지원합니다.
다양한 배포 옵션서버, 모바일 디바이스, 임베디드 및 IoT 디바이스의 배포를 지원합니다.
로우코드 개발로우코드 전체 프로세스 개발 도구를 제공하여 개발 문턱을 낮추고 개발 효율성을 개선합니다.

도움말 사용

설치 프로세스

환경 준비::
- Python 3.6 이상이 설치되어 있는지 확인합니다.
- 다음 명령어로 설치할 수 있는 패들패들 프레임워크를 설치합니다:
```
 pip install paddlepaddle
```
- PaddleOCR을 설치합니다:
```
 pip install paddleocr
```
모델 다운로드::
- 공식 리포지토리에서 사전 학습된 모델을 다운로드하고, 구체적인 다운로드 링크와 명령은 공식 문서를 참조하세요.
실행 예제::
- 다음 명령을 사용하여 OCR 예제를 실행합니다: bash paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer

기능 작동 흐름

텍스트 인식::

인식할 이미지 파일을 준비합니다.
활용 paddleocr 명령줄 도구 또는 Python API를 사용하여 식별할 수 있습니다.
샘플 코드:

 from paddleocr import PaddleOCR, draw_ocr
import matplotlib.pyplot as plt
import cv2
ocr = PaddleOCR(use_angle_cls=True, lang='ch')
img_path = 'path/to/your/image.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
boxes = [elements[0] for elements in result]
txts = [elements[1][0] for elements in result]
scores = [elements[1][1] for elements in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()

양식 인식::

양식이 포함된 이미지 파일을 준비합니다.
활용 paddleocr 양식 인식을 위한 명령줄 도구 또는 Python API.
샘플 코드:

 from paddleocr import PPStructure, draw_structure_result
import cv2
table_engine = PPStructure(show_log=True)
img_path = 'path/to/your/table_image.jpg'
result = table_engine(img_path)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()

레이아웃 영역 감지::

복잡한 레이아웃이 포함된 이미지 파일을 준비합니다.
활용 paddleocr 레이아웃 영역 감지를 위한 명령줄 도구 또는 Python API.
샘플 코드:

 from paddleocr import PaddleOCR, draw_ocr
import matplotlib.pyplot as plt
import cv2
ocr = PaddleOCR(use_angle_cls=True, lang='ch')
img_path = 'path/to/your/layout_image.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
boxes = [elements[0] for elements in result]
txts = [elements[1][0] for elements in result]
scores = [elements[1][1] for elements in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()