InternVLA-M1 - "Cerebro" de funcionamiento del sistema dual encarnado de código abierto del Laboratorio de Inteligencia Artificial de Shanghai

Últimos recursos sobre IAPublicado hace 7 meses Círculo de intercambio de inteligencia artificial

33.2K 00

¿Qué es InternVLA-M1?

InternVLA-M1 es un "cerebro" operativo encarnado de código abierto del Laboratorio de Inteligencia Artificial de Shanghai, que es un gran modelo de funcionamiento de dos sistemas orientado al seguimiento de instrucciones. Construye un bucle cerrado completo que abarca "pensar-actuar-aprender" y es responsable del razonamiento espacial de alto nivel y de la planificación de tareas. El modelo adopta una estrategia de entrenamiento en dos fases: en primer lugar, mediante el preentrenamiento de la percepción espacial para mejorar el razonamiento espacial y la capacidad de planificación y, a continuación, mediante el razonamiento espacial implícito para lograr un entrenamiento eficaz tras la acción. Para un entrenamiento eficaz sólo se necesitan "pistas de planificación espacial", lo que reduce significativamente el coste. InternVLA-M1 alcanza el nivel de liderazgo internacional en pruebas de referencia operativas públicas como SimplerEnv, y sus capacidades de seguimiento de órdenes y generalización de objetos invisibles son significativamente mejores que las de otros modelos similares. Basándose en la plataforma de simulación de desarrollo propio InternData-M1, InternVLA-M1 completa el preentrenamiento a gran escala, lo que resulta adecuado para escenarios complejos y tareas de largo alcance.

Características funcionales de InternVLA-M1

Capacidad de razonamiento espacial de orden superior: Puede percibir y razonar con precisión sobre entornos espaciales complejos y planificar eficazmente trayectorias de operaciones y secuencias de acciones.
Estrategia de formación en doble sistemaCombinación de preentrenamiento de percepción espacial y postentrenamiento de acción para mejorar la adaptabilidad y la capacidad de generalización del modelo en diferentes tareas.
Formación eficaz y optimización de costes: Lograr un entrenamiento eficaz mediante señales de planificación espacial, reduciendo significativamente el coste y el tiempo de entrenamiento y mejorando la utilidad del modelo.
Seguimiento de instrucciones y capacidad de generalizaciónSólidas capacidades de análisis sintáctico y ejecución de instrucciones, comprensión y ejecución precisas de instrucciones en lenguaje natural, buen rendimiento de generalización para objetos no vistos y nuevas tareas.
Aprendizaje autónomo y control en bucle cerradoConstruir un bucle cerrado "pensar-actuar-aprender" completo para que el modelo pueda aprenderse y optimizarse en la práctica y adaptarse a entornos dinámicos.
Adaptabilidad a escenarios complejos: Excelente rendimiento en escenas complejas de máquinas reales y tareas de largo alcance, adecuado para una gran variedad de escenarios de aplicación práctica, como la automatización industrial, la logística y el almacenamiento.
Código abierto y apoyo comunitario: Datos y código de fuente abierta, que ofrecen un rico recurso a investigadores y desarrolladores para fomentar la innovación y el desarrollo de aplicaciones en la comunidad.

Principales ventajas de InternVLA-M1

Seguimiento eficaz de las instrucciones y capacidad de generalizaciónComprende con precisión órdenes en lenguaje natural, genera secuencias de acciones ejecutables y demuestra una gran capacidad de generalización con objetos desconocidos y tareas nuevas.
Innovadora arquitectura de doble sistemaLa combinación del preentrenamiento de la percepción espacial y el postentrenamiento de la acción consigue una ejecución en bucle cerrado desde la percepción hasta la acción, y mejora la estabilidad y la adaptabilidad del modelo.
Estrategias de formación basadas en la ordenación territorialLa formación eficaz se consigue introduciendo pistas de planificación espacial, lo que mejora significativamente la eficacia de la formación y el rendimiento del modelo.
Soporte de datos de simulación a gran escalaLa plataforma de simulación InternData-M1, de desarrollo propio, permite generar una gran cantidad de datos de entrenamiento de alta calidad, lo que mejora la capacidad de generalización del modelo y la adaptabilidad a las tareas.
Código abierto y apoyo comunitario: código y datos de código abierto, que proporcionan un rico recurso a investigadores y desarrolladores para fomentar la innovación y el desarrollo de aplicaciones en la comunidad.
Rendimiento líderMisión: Logró el liderazgo internacional en varias referencias operativas públicas, especialmente en escenarios complejos y tareas de largo alcance.
Aplicabilidad en múltiples escenariosEste programa es aplicable a un amplio abanico de campos, como la familia, la industria, la logística, la educación, etc., y sienta una sólida base tecnológica para la aplicación de robots de uso general en escenarios reales.

¿Cuál es la página web oficial de InternVLA-M1?

Página web del proyecto:: https://internrobotics.github.io/internvla-m1.github.io/
Repositorio Github:: https://github.com/InternRobotics/InternVLA-M1
Biblioteca de modelos HuggingFace:: https://huggingface.co/collections/InternRobotics/internvla-m1-68c96eaebcb5867786ee6cf3
Enlaces de datos de HuggingFace:: https://huggingface.co/datasets/InternRobotics/InternData-M1
Documentos técnicos:: https://github.com/InternRobotics/InternVLA-M1/blob/InternVLA-M1/assets/InternVLA_M1.pdf

Personas para las que está indicada InternVLA-M1

Investigadores en inteligencia artificial y robóticaInternVLA-M1 puede servir a los investigadores de los campos de la inteligencia incorporada, la manipulación robótica y el modelado del lenguaje visual para explorar nuevas vías tecnológicas y escenarios de aplicación.
Ingeniero de desarrollo de sistemas robóticosLos ingenieros implicados en el desarrollo, integración y optimización de sistemas robóticos podrán utilizar el InternVLA-M1 para mejorar la capacidad del robot para operar y seguir órdenes en tareas complejas.
Profesores y estudiantes de universidades e institutos de investigaciónEl InternVLA-M1 puede ser utilizado por profesores y estudiantes de informática, automatización, ingeniería robótica y otras disciplinas afines como herramienta de enseñanza e investigación para proyectos prácticos e investigación académica.
Automatización industrial y empresas de fabricación inteligenteLa InternVLA-M1 está diseñada para empresas que desean introducir soluciones robóticas más inteligentes y flexibles en sus líneas de producción, lo que permite mejorar la automatización y aumentar la eficiencia.
Profesionales del sector de la logística y el almacenamientoPara las empresas y profesionales interesados en la automatización logística y la optimización de almacenes, la InternVLA-M1 puede utilizarse para operaciones inteligentes de preparación de pedidos y manipulación de mercancías.
Desarrolladores de robótica de serviciosInternVLA-M1 puede mejorar las capacidades de interacción y ejecución de tareas del robot y ampliar el abanico de aplicaciones de los equipos que desarrollan robots de servicio doméstico y robots de servicio comercial.