InternVLA-N1 - Modelo grande de navegación de doble sistema de código abierto de Shanghai AI Lab

堆友AI

¿Qué es InternVLA-N1?

InternVLA-N1 es un macromodelo de navegación de doble sistema de código abierto del Laboratorio de Inteligencia Artificial de Shanghai. Utilizando una arquitectura de doble sistema, el Sistema 2 se encarga de comprender las órdenes lingüísticas y planificar las trayectorias de largo alcance, mientras que el Sistema 1 se centra en la respuesta de alta frecuencia y la evitación ágil de obstáculos. El modelo se entrena enteramente a partir de datos sintéticos, y se consigue un proceso de entrenamiento rentable mediante activos de escenas digitales a gran escala y un corpus multimodal masivo. En varias pruebas de referencia, InternVLA-N1 obtiene buenos resultados y se sitúa a la cabeza de la clasificación internacional, demostrando una gran capacidad de generalización con muestra cero. InternVLA-N1 es capaz de recorrer largas distancias a través de edificios y evitar obstáculos con agilidad.

InternVLA·N1 - 上海AI Lab开源的端到端双系统导航大模型

Características funcionales de InternVLA-N1

  • Sistema dual de navegación conjuntaSistema 1: Combina el razonamiento espacial de largo alcance del Sistema 2 con la capacidad de evitación de obstáculos de alta frecuencia del Sistema 1 para lograr una navegación eficaz y estable.
  • Entrenamiento con datos sintéticos puros: Al depender únicamente de datos sintéticos para completar el entrenamiento, se reducen drásticamente los costes de adquisición de datos al tiempo que se mantiene un rendimiento excelente.
  • Capacidad de generalización de muestra cero: Adaptarse rápidamente y realizar con precisión tareas de navegación en entornos nuevos sin datos adicionales del escenario real.
  • Respuesta de alta frecuencia y evasión ágil de obstáculosSistema 1: responde a los cambios del entorno a 60 Hz, lo que garantiza la flexibilidad para evitar obstáculos en escenarios complejos.
  • interacción multimodalPermite la introducción de comandos verbales y la percepción visual del entorno para que la interacción persona-ordenador sea natural y fluida.
  • Versatilidad entre escenariosAmplia gama de aplicaciones para una gran variedad de escenarios complejos, como interiores, exteriores y entre edificios.
  • Código abierto y escalabilidadEl código fuente abierto y los modelos se proporcionan para facilitar el desarrollo secundario y la expansión de la aplicación por parte de los desarrolladores.

Principales ventajas de InternVLA-N1

  • Funciones de navegación eficacesLa combinación orgánica de la planificación de largo alcance y la evitación de obstáculos de alta frecuencia se realiza mediante el trabajo sinérgico de los sistemas duales, lo que mejora significativamente la eficacia y la estabilidad de la navegación.
  • Formación basada en datos y de bajo costeLa formación se basa por completo en datos sintéticos, lo que elimina la necesidad de recopilar grandes cantidades de datos reales y reduce significativamente los costes y el tiempo de formación.
  • Gran capacidad de generalizaciónse comporta bien en entornos reales con una fuerte generalización de muestra cero incluso cuando se entrena utilizando sólo datos sintéticos.
  • Respuesta de alta frecuencia y evasión ágil de obstáculosSistema 1: responde a los cambios del entorno a una frecuencia de 60 Hz, lo que garantiza una evitación flexible de obstáculos y la adaptación a entornos dinámicos en escenas complejas.
  • Apoyo a la interacción multimodalPermite la introducción de comandos verbales y la percepción visual del entorno para lograr una interacción natural y fluida entre el ser humano y el ordenador y mejorar la experiencia del usuario.
  • Amplia gama de aplicaciones: Es muy versátil para una amplia gama de escenarios complejos, como interiores, exteriores y entre edificios.

¿Cuál es la página web oficial de InternVLA-N1?

  • Página web del proyecto:: https://internrobotics.github.io/internvla-n1.github.io/
  • Repositorio GitHub:: https://github.com/InternRobotics/InternNav
  • Biblioteca de modelos de caras abrazadas:: https://huggingface.co/InternRobotics/InternVLA-N1
  • Documentos técnicos:: https://internrobotics.github.io/internvla-n1.github.io/static/pdfs/InternVLA_N1.pdf

Personas aplicables de InternVLA-N1

  • Investigadores en inteligencia artificial: Investigadores interesados en grandes modelos de navegación y que deseen estudiar y mejorar los algoritmos de navegación.
  • Ingeniero en robótica: Ingenieros que desarrollan robots de servicio, robots logísticos, etc. que requieren funciones de navegación.
  • Desarrolladores de conducción autónomaDesarrolladores que trabajan en tecnologías de conducción automatizada que requieren funciones eficaces de planificación de trayectorias y evitación de obstáculos.
  • Desarrollador de realidad virtual y aumentadaDesarrolladores que necesitan implementar funciones de interacción y navegación naturales en aplicaciones de RV/RA.
  • Profesionales de la seguridad inteligentes: Profesionales del ámbito de la seguridad inteligente que necesitan implantar patrullas inteligentes y responder a anomalías.
  • Ingeniero en Automatización Industrial: Ingenieros que necesitan automatizar la navegación y el funcionamiento de equipos en entornos industriales.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...