PaddleOCR: Многоязычная библиотека инструментов OCR на основе Flying Paddle, поддерживающая распознавание более 80 языков.

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

84.2K 00

Общее введение

PaddleOCR - это многоязычный инструментарий OCR, основанный на PaddlePaddle и предназначенный для создания практичной и сверхлегкой системы OCR. Он поддерживает распознавание более 80 языков и предоставляет инструменты аннотирования и синтеза данных для поддержки обучения и развертывания на серверах, мобильных устройствах, встраиваемых и IoT-устройствах. paddleOCR объединяет коррекцию текстового изображения, обнаружение области макета, обнаружение обычного текста, обнаружение текста на штампе, распознавание текста, распознавание таблиц и другие функции, значительно снижая стоимость разработки, и поддерживает высокопроизводительные рассуждения, развертывание на основе услуг и конечное развертывание. Он также поддерживает высокопроизводительные умозаключения, развертывание на основе сервисов и конечное развертывание.

Список функций

многоязычное распознавание: Поддерживается распознавание текста на более чем 80 языках.
Инструменты для аннотирования и синтеза данных: Предоставьте удобные инструменты аннотирования и синтеза данных для быстрого создания обучающих данных.
Коррекция текстовых изображений: Встроенная функция коррекции изображения текста для повышения точности распознавания.
Определение области макета: Поддержка высокоточного определения области компоновки для разбора сложных документов.
Распознавание форм: Обеспечивает функцию распознавания формы, способную точно извлекать данные о форме.
Обнаружение текста печати: Поддерживает обнаружение и распознавание штампованного текста.
Высокопроизводительные рассуждения: Поддержка высокопроизводительных выводов для приложений реального времени.
Несколько вариантов развертывания: Поддерживает развертывание серверов, мобильных устройств, встраиваемых и IoT-устройств.
Разработка с минимальным кодом: Предоставление инструментов для полнопроцессной разработки с низким кодом для снижения порога разработки и повышения эффективности разработки.

Использование помощи

Процесс установки

Подготовка к защите окружающей среды::
- Убедитесь, что установлена версия Python 3.6 или более поздняя.
- Установите фреймворк PaddlePaddle, который можно установить с помощью следующей команды:
```
 pip install paddlepaddle
```
- Установите PaddleOCR:
```
 pip install paddleocr
```
Скачать модели::
- Загрузите предварительно обученные модели из официального репозитория, ссылки и команды для загрузки можно найти в официальной документации.
пример работы::
- Чтобы запустить пример OCR, выполните следующую команду: bash paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer

Функции Поток операций

распознавание текста::

Подготовьте файл изображения для распознавания.
пользоваться paddleocr инструмент командной строки или Python API для идентификации.
Код примера:

 from paddleocr import PaddleOCR, draw_ocr
import matplotlib.pyplot as plt
import cv2
ocr = PaddleOCR(use_angle_cls=True, lang='ch')
img_path = 'path/to/your/image.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
boxes = [elements[0] for elements in result]
txts = [elements[1][0] for elements in result]
scores = [elements[1][1] for elements in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()

Распознавание форм::

Подготовьте файл изображения, содержащий форму.
пользоваться paddleocr Инструмент командной строки или Python API для распознавания форм.
Код примера:

 from paddleocr import PPStructure, draw_structure_result
import cv2
table_engine = PPStructure(show_log=True)
img_path = 'path/to/your/table_image.jpg'
result = table_engine(img_path)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()

Определение области макета::

Подготовка файлов изображений со сложными макетами.
пользоваться paddleocr Инструмент командной строки или Python API для определения области компоновки.
Код примера:

 from paddleocr import PaddleOCR, draw_ocr
import matplotlib.pyplot as plt
import cv2
ocr = PaddleOCR(use_angle_cls=True, lang='ch')
img_path = 'path/to/your/layout_image.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
boxes = [elements[0] for elements in result]
txts = [elements[1][0] for elements in result]
scores = [elements[1][1] for elements in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()