PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.
Últimos recursos sobre IAActualizado hace 8 meses Círculo de intercambio de inteligencia artificial 2.9K 00
Introducción general
PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Soporta el reconocimiento de más de 80 idiomas, y proporciona herramientas de anotación y síntesis de datos para apoyar la formación y el despliegue en servidores, dispositivos móviles, dispositivos embebidos y IoT. paddleOCR integra corrección de imagen de texto, detección de área de diseño, detección de texto regular, detección de texto de sello, reconocimiento de texto, reconocimiento de tablas y otras características, reduciendo significativamente los costes de desarrollo, y soporta razonamiento de alto rendimiento, despliegue basado en servicios y despliegue del lado final. También admite la inferencia de alto rendimiento, el despliegue basado en servicios y el despliegue en el extremo.
Lista de funciones
- reconocimiento multilingüeReconocimiento de texto en más de 80 idiomas.
- Herramientas de anotación y síntesis de datosHerramientas de anotación y síntesis de datos : Proporcionan cómodas herramientas de anotación y síntesis de datos para ayudar a generar rápidamente datos de entrenamiento.
- Corrección de imágenes de texto: Función integrada de corrección de imágenes de texto para mejorar la precisión del reconocimiento.
- Detección del área de diseño: Admite la detección de áreas de diseño de alta precisión para el análisis sintáctico de documentos complejos.
- reconocimiento de formulariosFunción de reconocimiento de tablas, capaz de extraer datos de tablas con precisión.
- Detección de texto de sellado: Admite la detección y el reconocimiento de texto sellado.
- Razonamiento de alto rendimiento: Admite la inferencia de alto rendimiento para aplicaciones en tiempo real.
- Múltiples opciones de despliegue: Admite la implantación de servidores, dispositivos móviles, dispositivos integrados y dispositivos IoT.
- Desarrollo de bajo códigoHerramientas de desarrollo de proceso completo de bajo código para reducir el umbral de desarrollo y mejorar la eficacia del mismo.
Utilizar la ayuda
Proceso de instalación
- Preparación medioambiental::
- Asegúrese de que Python 3.6 o posterior está instalado.
- Instale el framework PaddlePaddle, que puede instalarse con el siguiente comando:
pip install paddlepaddle
- Instalar PaddleOCR:
pip install paddleocr
- Descargar modelos::
- Descargue los modelos preentrenados del repositorio oficial, puede consultar la documentación oficial para obtener los enlaces y comandos de descarga específicos.
- ejemplo de funcionamiento::
- Utilice el siguiente comando para ejecutar el ejemplo de OCR:
bash
paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer
- Utilice el siguiente comando para ejecutar el ejemplo de OCR:
Función Flujo de operaciones
- reconocimiento de texto::
- Prepare el archivo de imagen que desea reconocer.
- utilizar
paddleocr
o la API de Python para la identificación. - Código de ejemplo:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- reconocimiento de formularios::
- Prepare el archivo de imagen que contiene el formulario.
- utilizar
paddleocr
Herramienta de línea de comandos o API Python para el reconocimiento de formularios. - Código de ejemplo:
from paddleocr import PPStructure, draw_structure_result import cv2 table_engine = PPStructure(show_log=True) img_path = 'path/to/your/table_image.jpg' result = table_engine(img_path) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- Detección del área de diseño::
- Prepare archivos de imagen que contengan diseños complejos.
- utilizar
paddleocr
Herramienta de línea de comandos o API de Python para la detección de áreas de diseño. - Código de ejemplo:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/layout_image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...