일반 소개
PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하고 데이터 주석 및 합성 도구를 제공하여 서버, 모바일 장치, 임베디드 및 IoT 장치에 대한 교육 및 배포를 지원합니다. paddleOCR은 텍스트 이미지 보정, 레이아웃 영역 감지, 일반 텍스트 감지, 스탬프 텍스트 감지, 텍스트 인식, 표 인식 및 기타 기능을 통합하여 개발 비용을 크게 절감하고 고성능 추론, 서비스 기반 배포 및 엔드사이드 배포를 지원합니다. 또한 고성능 추론, 서비스형 배포, 엔드사이드 배포를 지원합니다.
기능 목록
- 다국어 인식80개 이상의 언어로 텍스트 인식이 지원됩니다.
- 데이터 주석 및 합성 도구편리한 데이터 주석 및 합성 도구를 제공하여 학습 데이터를 빠르게 생성할 수 있도록 지원합니다.
- 텍스트 이미지 보정텍스트 이미지 보정 기능을 통합하여 인식 정확도를 높였습니다.
- 레이아웃 영역 감지복잡한 문서 구문 분석을 위한 고정밀 레이아웃 영역 감지 기능을 지원합니다.
- 양식 인식테이블 인식 기능 제공, 테이블 데이터를 정확하게 추출할 수 있습니다.
- 인감 텍스트 감지: 스탬프가 찍힌 텍스트의 감지 및 인식을 지원합니다.
- 고성능 추론실시간 애플리케이션을 위한 고성능 추론을 지원합니다.
- 다양한 배포 옵션서버, 모바일 디바이스, 임베디드 및 IoT 디바이스의 배포를 지원합니다.
- 로우코드 개발로우코드 전체 프로세스 개발 도구를 제공하여 개발 문턱을 낮추고 개발 효율성을 개선합니다.
도움말 사용
설치 프로세스
- 환경 준비::
- Python 3.6 이상이 설치되어 있는지 확인합니다.
- 다음 명령어로 설치할 수 있는 패들패들 프레임워크를 설치합니다:
pip install paddlepaddle
- PaddleOCR을 설치합니다:
pip install paddleocr
- 모델 다운로드::
- 공식 리포지토리에서 사전 학습된 모델을 다운로드하고, 구체적인 다운로드 링크와 명령은 공식 문서를 참조하세요.
- 실행 예제::
- 다음 명령을 사용하여 OCR 예제를 실행합니다:
bash
paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer
- 다음 명령을 사용하여 OCR 예제를 실행합니다:
기능 작동 흐름
- 텍스트 인식::
- 인식할 이미지 파일을 준비합니다.
- 활용
paddleocr
명령줄 도구 또는 Python API를 사용하여 식별할 수 있습니다. - 샘플 코드:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- 양식 인식::
- 양식이 포함된 이미지 파일을 준비합니다.
- 활용
paddleocr
양식 인식을 위한 명령줄 도구 또는 Python API. - 샘플 코드:
from paddleocr import PPStructure, draw_structure_result import cv2 table_engine = PPStructure(show_log=True) img_path = 'path/to/your/table_image.jpg' result = table_engine(img_path) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- 레이아웃 영역 감지::
- 복잡한 레이아웃이 포함된 이미지 파일을 준비합니다.
- 활용
paddleocr
레이아웃 영역 감지를 위한 명령줄 도구 또는 Python API. - 샘플 코드:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/layout_image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...