PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.
Últimos recursos sobre IAActualizado hace 10 meses Círculo de intercambio de inteligencia artificial 28.5K 00
Introducción general
PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Soporta el reconocimiento de más de 80 idiomas, y proporciona herramientas de anotación y síntesis de datos para apoyar la formación y el despliegue en servidores, dispositivos móviles, dispositivos embebidos y IoT. paddleOCR integra corrección de imagen de texto, detección de área de diseño, detección de texto regular, detección de texto de sello, reconocimiento de texto, reconocimiento de tablas y otras características, reduciendo significativamente los costes de desarrollo, y soporta razonamiento de alto rendimiento, despliegue basado en servicios y despliegue del lado final. También admite la inferencia de alto rendimiento, el despliegue basado en servicios y el despliegue en el extremo.
Lista de funciones
- reconocimiento multilingüeReconocimiento de texto en más de 80 idiomas.
- Herramientas de anotación y síntesis de datosHerramientas de anotación y síntesis de datos : Proporcionan cómodas herramientas de anotación y síntesis de datos para ayudar a generar rápidamente datos de entrenamiento.
- Corrección de imágenes de texto: Función integrada de corrección de imágenes de texto para mejorar la precisión del reconocimiento.
- Detección del área de diseño: Admite la detección de áreas de diseño de alta precisión para el análisis sintáctico de documentos complejos.
- reconocimiento de formulariosFunción de reconocimiento de tablas, capaz de extraer datos de tablas con precisión.
- Detección de texto de sellado: Admite la detección y el reconocimiento de texto sellado.
- Razonamiento de alto rendimiento: Admite la inferencia de alto rendimiento para aplicaciones en tiempo real.
- Múltiples opciones de despliegue: Admite la implantación de servidores, dispositivos móviles, dispositivos integrados y dispositivos IoT.
- Desarrollo de bajo códigoHerramientas de desarrollo de proceso completo de bajo código para reducir el umbral de desarrollo y mejorar la eficacia del mismo.
Utilizar la ayuda
Proceso de instalación
- Preparación medioambiental::
- Asegúrese de que Python 3.6 o posterior está instalado.
- Instale el framework PaddlePaddle, que puede instalarse con el siguiente comando:
pip install paddlepaddle
- Instalar PaddleOCR:
pip install paddleocr
- Descargar modelos::
- Descargue los modelos preentrenados del repositorio oficial, puede consultar la documentación oficial para obtener los enlaces y comandos de descarga específicos.
- ejemplo de funcionamiento::
- Utilice el siguiente comando para ejecutar el ejemplo de OCR:
bash
paddleocr --image_dir ./doc/imgs/11.jpg --det_model_dir ./inference/ch_ppocr_mobile_v2.0_det_infer --rec_model_dir ./inference/ch_ppocr_mobile_v2.0_rec_infer --cls_model_dir ./inference/ch_ppocr_mobile_v2.0_cls_infer
- Utilice el siguiente comando para ejecutar el ejemplo de OCR:
Función Flujo de operaciones
- reconocimiento de texto::
- Prepare el archivo de imagen que desea reconocer.
- utilizar
paddleocr
o la API de Python para la identificación. - Código de ejemplo:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- reconocimiento de formularios::
- Prepare el archivo de imagen que contiene el formulario.
- utilizar
paddleocr
Herramienta de línea de comandos o API Python para el reconocimiento de formularios. - Código de ejemplo:
from paddleocr import PPStructure, draw_structure_result import cv2 table_engine = PPStructure(show_log=True) img_path = 'path/to/your/table_image.jpg' result = table_engine(img_path) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) im_show = draw_structure_result(image, result, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
- Detección del área de diseño::
- Prepare archivos de imagen que contengan diseños complejos.
- utilizar
paddleocr
Herramienta de línea de comandos o API de Python para la detección de áreas de diseño. - Código de ejemplo:
from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt import cv2 ocr = PaddleOCR(use_angle_cls=True, lang='ch') img_path = 'path/to/your/layout_image.jpg' result = ocr.ocr(img_path, cls=True) for line in result: print(line) # 可视化结果 image = cv2.imread(img_path) boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/your/font.ttf') im_show = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB) plt.imshow(im_show) plt.show()
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...