Egocentric-10K - Conjunto de datos robóticos de código abierto sobre la perspectiva en primera persona de Build AI
Últimos recursos sobre IAPublicado hace 1 mes Círculo de intercambio de inteligencia artificial 13.9K 00
Qué es Egocentric-10K
Egocentric-10K es un conjunto de datos de vídeo egocéntrico a gran escala de operaciones de fábrica, de código abierto por el equipo build.ai. El conjunto de datos contiene 10.000 horas de vídeo con un total de 1.080 millones de fotogramas, en los que participaron 2.138 trabajadores, cada uno de los cuales aportó una media de 4,68 horas de contenido de vídeo. El conjunto de datos consta de 192 900 clips de vídeo, cada uno con una duración media de 180 segundos y un tamaño de almacenamiento de 16,4 TB en formato H.265/MP4 con una resolución de 1080p y una velocidad de fotogramas de 30 fps, que presenta una alta densidad de escenas operativas y una alta frecuencia de visibilidad de las manos, lo que supone una mejora significativa en comparación con los conjuntos de datos de campo anteriores.

Características funcionales de Egocentric-10K
- Datos a gran escalaLa visión en primera persona de la fuente de vídeo más popular del mundo: 10.000 horas de vídeo, con un total de 1.080 millones de fotogramas, que proporcionan a los investigadores una enorme cantidad de datos de perspectiva en primera persona.
- Entorno real de fábricaLos datos proceden en su totalidad de escenarios reales de fábricas, que resultan muy prácticos y realistas para la investigación relacionada con la industria.
- Funcionamiento de alta densidad: La frecuente y alta visibilidad de la manipulación de manos en los vídeos hace que las escenas de manipulación sean más intensivas en comparación con los conjuntos de datos tradicionales, lo que resulta adecuado para el reconocimiento de acciones y el aprendizaje de tareas.
- Compromiso de los trabajadores con la diversidad: Participaron 2.138 trabajadores, cada uno de los cuales aportó una media de 4,68 horas de vídeo, con datos procedentes de un amplio abanico de fuentes que cubrían una gran variedad de estilos y hábitos operativos.
- Almacenamiento y formateo eficacesEl formato H.265/MP4, con una resolución de 1080p y una frecuencia de imagen de 30 fps, garantiza la calidad de vídeo al tiempo que optimiza el espacio de almacenamiento.
- Fácil acceso y usoLos datos se organizan en formato WebDataset para cargarlos y procesarlos con rapidez, lo que resulta idóneo para el aprendizaje automático y el análisis de datos a gran escala.
- Aplicaciones multidisciplinaresLa tecnología de la información es aplicable a una amplia gama de campos, como el aprendizaje de los robots, la visión industrial y el reconocimiento del movimiento, lo que supone un gran apoyo para el desarrollo y la investigación de tecnologías afines.
Principales ventajas del Egocentric-10K
- Datos realesRecogidos íntegramente en el entorno de una fábrica real, lo que garantiza un alto grado de realismo y practicidad de los datos, adecuados para estudios de escenarios industriales.
- Gran volumen de datosLa investigación es una rica fuente de material: se incluyen 10.000 horas de vídeo, con un total de 1.080 millones de fotogramas.
- Funcionamiento de alta densidadEl objetivo de este artículo es analizar la relación entre el reconocimiento de acciones y el aprendizaje de tareas en las escenas operativas densas y la alta visibilidad de las manos en los vídeos.
- Diversas fuentes de datosEn el estudio participaron 2.138 trabajadores, y los datos abarcaron una amplia gama de estilos y hábitos operativos, lo que los hace ampliamente representativos.
- Formatos de datos eficientes: formato H.265/MP4 para optimizar la eficiencia del almacenamiento y la transmisión manteniendo una alta calidad.
- fácil de usarOrganizado en formato WebDataset para una carga y procesamiento rápidos, adecuado para el aprendizaje automático a gran escala.
¿Cuál es la página web oficial de Egocentric-10K?
- Biblioteca de modelos HuggingFace:: https://huggingface.co/datasets/builddotai/Egocentric-10K
Personas para las que Egocentric-10K es adecuado
- Investigadores en robótica: pueden utilizarse para entrenar y optimizar robots que operan en entornos industriales, ayudándoles a comprender y realizar mejor las tareas.
- Especialistas en visión artificial: Proporciona ricos datos de visión en primera persona para desarrollar y probar sistemas de visión industrial, mejorando el reconocimiento y el análisis de sistemas en entornos complejos.
- Desarrolladores de inteligencia artificialProporcionar datos de formación a gran escala para modelos de aprendizaje automático y aprendizaje profundo con el fin de respaldar el desarrollo y la optimización de algoritmos.
- Ingeniero en Automatización Industrial: Ayudar a investigar y desarrollar soluciones de automatización más eficaces que mejoren la eficiencia y la calidad de la producción industrial.
- Investigadores universitarios: Proporcionar un soporte de datos de alta calidad para la investigación académica en campos afines y promover el desarrollo de la investigación teórica y aplicada.
- Analista de datos industriales: Puede utilizarse para analizar el comportamiento de los trabajadores, optimizar los flujos de trabajo y mejorar la productividad y la seguridad.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...




