PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

82.3K 00

Introducción general

PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Soporta el reconocimiento de más de 80 idiomas, y proporciona herramientas de anotación y síntesis de datos para apoyar la formación y el despliegue en servidores, dispositivos móviles, dispositivos embebidos y IoT. paddleOCR integra corrección de imagen de texto, detección de área de diseño, detección de texto regular, detección de texto de sello, reconocimiento de texto, reconocimiento de tablas y otras características, reduciendo significativamente los costes de desarrollo, y soporta razonamiento de alto rendimiento, despliegue basado en servicios y despliegue del lado final. También admite la inferencia de alto rendimiento, el despliegue basado en servicios y el despliegue en el extremo.

Lista de funciones

reconocimiento multilingüeReconocimiento de texto en más de 80 idiomas.
Herramientas de anotación y síntesis de datosHerramientas de anotación y síntesis de datos : Proporcionan cómodas herramientas de anotación y síntesis de datos para ayudar a generar rápidamente datos de entrenamiento.
Corrección de imágenes de texto: Función integrada de corrección de imágenes de texto para mejorar la precisión del reconocimiento.
Detección del área de diseño: Admite la detección de áreas de diseño de alta precisión para el análisis sintáctico de documentos complejos.
reconocimiento de formulariosFunción de reconocimiento de tablas, capaz de extraer datos de tablas con precisión.
Detección de texto de sellado: Admite la detección y el reconocimiento de texto sellado.
Razonamiento de alto rendimiento: Admite la inferencia de alto rendimiento para aplicaciones en tiempo real.
Múltiples opciones de despliegue: Admite la implantación de servidores, dispositivos móviles, dispositivos integrados y dispositivos IoT.
Desarrollo de bajo códigoHerramientas de desarrollo de proceso completo de bajo código para reducir el umbral de desarrollo y mejorar la eficacia del mismo.

Utilizar la ayuda

Proceso de instalación

Preparación medioambiental::
- Asegúrese de que Python 3.6 o posterior está instalado.
- Instale el framework PaddlePaddle, que puede instalarse con el siguiente comando:
```
 pip install paddlepaddle
```
- Instalar PaddleOCR:
```
 pip install paddleocr
```
Descargar modelos::
- Descargue los modelos preentrenados del repositorio oficial, puede consultar la documentación oficial para obtener los enlaces y comandos de descarga específicos.
ejemplo de funcionamiento::
- Utilice el siguiente comando para ejecutar el ejemplo de OCR: bash paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer

Función Flujo de operaciones

reconocimiento de texto::

Prepare el archivo de imagen que desea reconocer.
utilizar paddleocr o la API de Python para la identificación.
Código de ejemplo:

 from paddleocr import PaddleOCR, draw_ocr
import matplotlib.pyplot as plt
import cv2
ocr = PaddleOCR(use_angle_cls=True, lang='ch')
img_path = 'path/to/your/image.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
boxes = [elements[0] for elements in result]
txts = [elements[1][0] for elements in result]
scores = [elements[1][1] for elements in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()

reconocimiento de formularios::

Prepare el archivo de imagen que contiene el formulario.
utilizar paddleocr Herramienta de línea de comandos o API Python para el reconocimiento de formularios.
Código de ejemplo:

 from paddleocr import PPStructure, draw_structure_result
import cv2
table_engine = PPStructure(show_log=True)
img_path = 'path/to/your/table_image.jpg'
result = table_engine(img_path)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()

Detección del área de diseño::

Prepare archivos de imagen que contengan diseños complejos.
utilizar paddleocr Herramienta de línea de comandos o API de Python para la detección de áreas de diseño.
Código de ejemplo:

 from paddleocr import PaddleOCR, draw_ocr
import matplotlib.pyplot as plt
import cv2
ocr = PaddleOCR(use_angle_cls=True, lang='ch')
img_path = 'path/to/your/layout_image.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
# 可视化结果
image = cv2.imread(img_path)
boxes = [elements[0] for elements in result]
txts = [elements[1][0] for elements in result]
scores = [elements[1][1] for elements in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf')
im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)
plt.imshow(im_show)
plt.show()