InternVLA-N1 - Shanghai AI Lab Open Source Dual System Navigation End-to-End Large Model (en anglais)
Qu'est-ce que InternVLA-N1 ?
InternVLA-N1 est un macromodèle de navigation à deux systèmes de bout en bout, à source ouverte, du laboratoire d'intelligence artificielle de Shanghai. Utilisant une architecture à double système, le système 2 est responsable de la compréhension des commandes linguistiques et de la planification des trajectoires à longue distance, tandis que le système 1 se concentre sur la réponse à haute fréquence et l'évitement agile des obstacles. Le modèle est entièrement entraîné à partir de données synthétiques, et un processus d'entraînement rentable est réalisé grâce à des scènes numériques à grande échelle et à un corpus multimodal massif. Dans plusieurs tests de référence courants, InternVLA-N1 obtient de bons résultats et se classe au premier rang international, démontrant une forte capacité de généralisation à partir de l'échantillon zéro. InternVLA-N1 est capable de marcher sur commande dans des scénarios réels sur de longues distances à travers des bâtiments et d'éviter des obstacles denses avec agilité.

Caractéristiques fonctionnelles de InternVLA-N1
- Co-navigation à deux systèmesLe système d'évitement des obstacles : Combinez le raisonnement spatial à longue portée du système 2 avec la capacité d'évitement des obstacles à haute fréquence du système 1 pour parvenir à une navigation efficace et stable.
- Formation aux données synthétiques puresLa formation est ainsi considérablement réduite en termes de coûts d'acquisition de données tout en conservant d'excellentes performances.
- Capacité de généralisation de l'échantillon zéroLes systèmes d'information sur la navigation : s'adapter rapidement et exécuter avec précision des tâches de navigation dans de nouveaux environnements sans données supplémentaires de scénario réel.
- Réponse à haute fréquence et évitement agile des obstaclesLe système 1 réagit aux modifications de l'environnement à une fréquence de 60 Hz, ce qui permet d'éviter les obstacles avec souplesse dans des scénarios complexes.
- interaction multimodaleLe système de gestion de l'environnement : il prend en charge la saisie de commandes verbales et la perception visuelle de l'environnement pour une interaction naturelle et fluide entre l'homme et l'ordinateur.
- Polyvalence des scénariosLes avantages de ce système sont les suivants : large gamme d'applications pour une variété de scénarios complexes, tels qu'à l'intérieur, à l'extérieur et entre les bâtiments.
- Source ouverte et évolutivitéLe code source ouvert et les modèles sont fournis pour faciliter le développement secondaire et l'expansion de l'application par les développeurs.
Principaux avantages de InternVLA-N1
- Capacités de navigation efficacesLa combinaison organique de la planification à long terme et de l'évitement des obstacles à haute fréquence est réalisée grâce au travail synergique des deux systèmes, ce qui améliore considérablement l'efficacité et la stabilité de la navigation.
- Une formation fondée sur des données et peu coûteuseLa formation est entièrement basée sur des données synthétiques, ce qui élimine la nécessité de collecter de grandes quantités de données réelles et réduit considérablement les coûts et le temps de formation.
- Forte capacité de généralisationLe logiciel : fonctionne bien dans des environnements réels avec une forte généralisation à zéro échantillon, même lorsqu'il a été formé en utilisant uniquement des données synthétiques.
- Réponse à haute fréquence et évitement agile des obstaclesLe système 1 réagit aux changements environnementaux à une fréquence de 60 Hz, ce qui permet d'éviter les obstacles avec souplesse et de s'adapter aux environnements dynamiques dans des scènes complexes.
- Soutien à l'interaction multimodaleLe système de gestion de l'environnement : il prend en charge la saisie de commandes verbales et la perception de l'environnement visuel afin de permettre une interaction naturelle et fluide entre l'homme et l'ordinateur et d'améliorer l'expérience de l'utilisateur.
- Large éventail d'applicationsIl est très polyvalent et convient à un large éventail de scénarios complexes, notamment à l'intérieur, à l'extérieur et entre les bâtiments.
Quel est le site web officiel de InternVLA-N1 ?
- Site web du projet: : https://internrobotics.github.io/internvla-n1.github.io/
- Dépôt GitHub: : https://github.com/InternRobotics/InternNav
- Bibliothèque de modèles de visages étreints: : https://huggingface.co/InternRobotics/InternVLA-N1
- Documents techniques: : https://internrobotics.github.io/internvla-n1.github.io/static/pdfs/InternVLA_N1.pdf
Personnes concernées par InternVLA-N1
- Chercheurs en intelligence artificielleLes chercheurs qui s'intéressent aux grands modèles de navigation et qui souhaitent étudier et améliorer les algorithmes de navigation.
- Ingénieur en robotiqueLes ingénieurs qui développent des robots de service, des robots logistiques, etc. qui requièrent des fonctions de navigation.
- Développeurs de la conduite autonomeLes développeurs travaillent sur des technologies de conduite automatisée qui nécessitent des fonctions efficaces de planification de la trajectoire et d'évitement des obstacles.
- Développeur en réalité virtuelle/réalité augmentéeLes développeurs qui ont besoin de mettre en œuvre des fonctions d'interaction et de navigation naturelles dans les applications VR/AR.
- Praticiens de la sécurité intelligenteLes utilisateurs : Les praticiens dans le domaine de la sécurité intelligente qui ont besoin de mettre en œuvre des patrouilles intelligentes et des réponses aux anomalies.
- Ingénieur en automatisation industrielleLes ingénieurs qui ont besoin d'automatiser la navigation et le fonctionnement des équipements dans les environnements industriels.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...