PaddleOCR: Многоязычная библиотека инструментов OCR на основе Flying Paddle, поддерживающая распознавание более 80 языков.

Общее введение

PaddleOCR - это многоязычный инструментарий OCR, основанный на PaddlePaddle и предназначенный для создания практичной и сверхлегкой системы OCR. Он поддерживает распознавание более 80 языков и предоставляет инструменты аннотирования и синтеза данных для поддержки обучения и развертывания на серверах, мобильных устройствах, встраиваемых и IoT-устройствах. paddleOCR объединяет коррекцию текстового изображения, обнаружение области макета, обнаружение обычного текста, обнаружение текста на штампе, распознавание текста, распознавание таблиц и другие функции, значительно снижая стоимость разработки, и поддерживает высокопроизводительные рассуждения, развертывание на основе услуг и конечное развертывание. Он также поддерживает высокопроизводительные умозаключения, развертывание на основе сервисов и конечное развертывание.

 

Список функций

  • многоязычное распознавание: Поддерживается распознавание текста на более чем 80 языках.
  • Инструменты для аннотирования и синтеза данных: Предоставьте удобные инструменты аннотирования и синтеза данных для быстрого создания обучающих данных.
  • Коррекция текстовых изображений: Встроенная функция коррекции изображения текста для повышения точности распознавания.
  • Определение области макета: Поддержка высокоточного определения области компоновки для разбора сложных документов.
  • Распознавание форм: Обеспечивает функцию распознавания формы, способную точно извлекать данные о форме.
  • Обнаружение текста печати: Поддерживает обнаружение и распознавание штампованного текста.
  • Высокопроизводительные рассуждения: Поддержка высокопроизводительных выводов для приложений реального времени.
  • Несколько вариантов развертывания: Поддерживает развертывание серверов, мобильных устройств, встраиваемых и IoT-устройств.
  • Разработка с минимальным кодом: Предоставление инструментов для полнопроцессной разработки с низким кодом для снижения порога разработки и повышения эффективности разработки.

 

Использование помощи

Процесс установки

  1. Подготовка к защите окружающей среды::
    • Убедитесь, что установлена версия Python 3.6 или более поздняя.
    • Установите фреймворк PaddlePaddle, который можно установить с помощью следующей команды:
     pip install paddlepaddle
    
    • Установите PaddleOCR:
     pip install paddleocr
    
  2. Скачать модели::
    • Загрузите предварительно обученные модели из официального репозитория, ссылки и команды для загрузки можно найти в официальной документации.
  3. пример работы::
    • Чтобы запустить пример OCR, выполните следующую команду: bash
      paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer

Функции Поток операций

  1. распознавание текста::
    • Подготовьте файл изображения для распознавания.
    • пользоваться paddleocr инструмент командной строки или Python API для идентификации.
    • Код примера:
     from paddleocr import PaddleOCR, draw_ocr
    import matplotlib.pyplot as plt
    import cv2
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    img_path = 'path/to/your/image.jpg'
    result = ocr.ocr(img_path, cls=True)
    for line in result:
    print(line)
    # 可视化结果
    image = cv2.imread(img_path)
    boxes = [elements[0] for elements in result]
    txts = [elements[1][0] for elements in result]
    scores = [elements[1][1] for elements in result]
    im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
    im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
    plt.imshow(im_show)
    plt.show()
    
  2. Распознавание форм::
    • Подготовьте файл изображения, содержащий форму.
    • пользоваться paddleocr Инструмент командной строки или Python API для распознавания форм.
    • Код примера:
     from paddleocr import PPStructure, draw_structure_result
    import cv2
    table_engine = PPStructure(show_log=True)
    img_path = 'path/to/your/table_image.jpg'
    result = table_engine(img_path)
    for line in result:
    print(line)
    # 可视化结果
    image = cv2.imread(img_path)
    im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf')
    im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
    plt.imshow(im_show)
    plt.show()
    
  3. Определение области макета::
    • Подготовка файлов изображений со сложными макетами.
    • пользоваться paddleocr Инструмент командной строки или Python API для определения области компоновки.
    • Код примера:
     from paddleocr import PaddleOCR, draw_ocr
    import matplotlib.pyplot as plt
    import cv2
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    img_path = 'path/to/your/layout_image.jpg'
    result = ocr.ocr(img_path, cls=True)
    for line in result:
    print(line)
    # 可视化结果
    image = cv2.imread(img_path)
    boxes = [elements[0] for elements in result]
    txts = [elements[1][0] for elements in result]
    scores = [elements[1][1] for elements in result]
    im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
    im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
    plt.imshow(im_show)
    plt.show()
    
© заявление об авторских правах

Похожие статьи

Chatbot Arena(LMSYS):大语言模型基准测试和多模型比较性能的在线竞技平台

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...