PaddleOCR: Многоязычная библиотека инструментов OCR на основе Flying Paddle, поддерживающая распознавание более 80 языков.
Общее введение
PaddleOCR - это многоязычный инструментарий OCR, основанный на PaddlePaddle и предназначенный для создания практичной и сверхлегкой системы OCR. Он поддерживает распознавание более 80 языков и предоставляет инструменты аннотирования и синтеза данных для поддержки обучения и развертывания на серверах, мобильных устройствах, встраиваемых и IoT-устройствах. paddleOCR объединяет коррекцию текстового изображения, обнаружение области макета, обнаружение обычного текста, обнаружение текста на штампе, распознавание текста, распознавание таблиц и другие функции, значительно снижая стоимость разработки, и поддерживает высокопроизводительные рассуждения, развертывание на основе услуг и конечное развертывание. Он также поддерживает высокопроизводительные умозаключения, развертывание на основе сервисов и конечное развертывание.
Список функций
- многоязычное распознавание: Поддерживается распознавание текста на более чем 80 языках.
- Инструменты для аннотирования и синтеза данных: Предоставьте удобные инструменты аннотирования и синтеза данных для быстрого создания обучающих данных.
- Коррекция текстовых изображений: Встроенная функция коррекции изображения текста для повышения точности распознавания.
- Определение области макета: Поддержка высокоточного определения области компоновки для разбора сложных документов.
- Распознавание форм: Обеспечивает функцию распознавания формы, способную точно извлекать данные о форме.
- Обнаружение текста печати: Поддерживает обнаружение и распознавание штампованного текста.
- Высокопроизводительные рассуждения: Поддержка высокопроизводительных выводов для приложений реального времени.
- Несколько вариантов развертывания: Поддерживает развертывание серверов, мобильных устройств, встраиваемых и IoT-устройств.
- Разработка с минимальным кодом: Предоставление инструментов для полнопроцессной разработки с низким кодом для снижения порога разработки и повышения эффективности разработки.
Использование помощи
Процесс установки
- Подготовка к защите окружающей среды::
- Убедитесь, что установлена версия Python 3.6 или более поздняя.
- Установите фреймворк PaddlePaddle, который можно установить с помощью следующей команды:
pip install paddlepaddle
- Установите PaddleOCR:
pip install paddleocr
- Скачать модели::
- Загрузите предварительно обученные модели из официального репозитория, ссылки и команды для загрузки можно найти в официальной документации.
- пример работы::
- Чтобы запустить пример OCR, выполните следующую команду:
bash
paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer
- Чтобы запустить пример OCR, выполните следующую команду:
Функции Поток операций
- распознавание текста::
- Подготовьте файл изображения для распознавания.
- пользоваться
paddleocr
инструмент командной строки или Python API для идентификации. - Код примера:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- Распознавание форм::
- Подготовьте файл изображения, содержащий форму.
- пользоваться
paddleocr
Инструмент командной строки или Python API для распознавания форм. - Код примера:
from paddleocr import PPStructure, draw_structure_result import cv2 table_engine = PPStructure(show_log=True) img_path = 'path/to/your/table_image.jpg' result = table_engine(img_path) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- Определение области макета::
- Подготовка файлов изображений со сложными макетами.
- пользоваться
paddleocr
Инструмент командной строки или Python API для определения области компоновки. - Код примера:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/layout_image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...