TF-ID: herramienta de reconocimiento de formularios/imágenes de documentos académicos

Últimos recursos sobre IAPublicado hace 2 años Círculo de intercambio de inteligencia artificial

51.8K 00

Introducción general

TF-ID (Table/Figure IDentifier) es una familia de modelos de detección de objetos dedicados a la extracción de tablas e imágenes de artículos académicos. El proyecto fue creado por Yifei Hu y está disponible en GitHub. Los modelos TF-ID se han perfeccionado para reconocer y extraer tablas e imágenes de artículos académicos, con o sin texto de pie de foto. El proyecto proporciona el código de entrenamiento completo, los pesos de los modelos y los conjuntos de datos etiquetados manualmente, todo ello bajo la licencia MIT.

Lista de funciones

Extraer tablas e imágenes de artículos académicos
Admite la extracción con o sin texto de cabecera
Proporcione el código de entrenamiento completo y las ponderaciones del modelo
Permite extraer tablas e imágenes de archivos PDF
Múltiples versiones de modelos disponibles para adaptarse a diferentes necesidades

Utilizar la ayuda

Proceso de instalación

Almacén de clonación:

git clone https://github.com/ai8hyf/TF-ID
cd TF-ID

Descargar el conjunto de datos: Descargue el conjunto de datos de Hugging Face y extráigalo al directorio adecuado.

wget https://huggingface.co/datasets/yifeihu/TF-ID-arxiv-papers/resolve/main/arxiv_paper_images.zip
unzip arxiv_paper_images.zip -d ./images

Convierte el formato del conjunto de datos:
```
python coco_to_florence.py
```
Modelos de formación:
```
accelerate launch train.py
```

Proceso de utilización

Extrae tablas e imágenes de una sola imagen:

python inference.py --image_path path/to/image.png

Extrae todas las tablas e imágenes de los archivos PDF:

python pdf_to_table_figures.py --pdf_path path/to/paper.pdf --output_dir ./sample_output

Procedimiento de funcionamiento detallado

Extraer tablas e imágenes de una sola imagen::
- Pasa la ruta de la imagen alinference.pyque utilizará el modelo por defecto TF-ID-large para extraer las tablas e imágenes de la imagen.
- Los resultados de la extracción se devolverán en forma de un cuadro delimitador que identifica la posición de la tabla y la imagen en la imagen.
Extrae todas las tablas e imágenes de los archivos PDF::
- Pasar la ruta del archivo PDF apdf_to_table_figures.pyque extraerá todas las tablas e imágenes del archivo PDF y guardará las imágenes recortadas en el directorio de salida especificado.
- Por defecto, para la extracción se utiliza el modelo TF-ID-large, que puede cambiarse modificando el scriptmodel_idpara cambiar a otra versión del modelo.
Modelos de formación::
- Tras clonar el repositorio y descargar el conjunto de datos, utilice la funcióncoco_to_florence.pyEl script convierte el conjunto de datos al formato Florence 2.
- utilizaraccelerate launch train.pyinicia el entrenamiento del modelo, y el archivo de puntos de control se guarda durante el entrenamiento.

Últimos recursos sobre IA # AI Java Proyecto de código abierto

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI # Producto interactivo multimodal en tiempo real

hace 1 año

069K

Humva: vídeo gratuito personalizado de una persona o doble digital generado a partir de una sola foto

Últimos recursos sobre IA # AI Digital Man

hace 10 meses

069.1K

Tú futuro: diálogo con tu yo futuro, exploración de posibilidades futuras, autorreflexión con diálogo de IA

Últimos recursos sobre IA # AI Herramientas educativas

hace 1 año

060.2K

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA # Aplicación de carrocería inteligente

hace 1 año

060.7K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

TF-ID: herramienta de reconocimiento de formularios/imágenes de documentos académicos

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Proceso de utilización

Procedimiento de funcionamiento detallado

FreeTTS: Herramienta gratuita de conversión de texto a voz en línea|Mejora de audio|Clips de audio

MoneyPrinterPlus: herramienta de IA para generar vídeos cortos con un solo clic, mezcla por lotes gratuita

Artículos relacionados

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Humva: vídeo gratuito personalizado de una persona o doble digital generado a partir de una sola foto

Tú futuro: diálogo con tu yo futuro, exploración de posibilidades futuras, autorreflexión con diálogo de IA

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Sin comentarios

Últimas colecciones

Últimos artículos

TF-ID: herramienta de reconocimiento de formularios/imágenes de documentos académicos

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Proceso de utilización

Procedimiento de funcionamiento detallado

FreeTTS: Herramienta gratuita de conversión de texto a voz en línea|Mejora de audio|Clips de audio

MoneyPrinterPlus: herramienta de IA para generar vídeos cortos con un solo clic, mezcla por lotes gratuita

Artículos relacionados

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Humva: vídeo gratuito personalizado de una persona o doble digital generado a partir de una sola foto

Tú futuro: diálogo con tu yo futuro, exploración de posibilidades futuras, autorreflexión con diálogo de IA

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos