¿Qué es un "modelo mundial" de IA? Por qué invierten en él Fei-Fei Li, Google y OpenAI?

El desarrollo de modelos de IA se diversifica cada vez más. Además de los modelos lingüísticos a gran escala y los modelos lingüísticos a pequeña escala, los "modelos del mundo", que se denominan simuladores del mundo, se consideran una de las próximas direcciones clave de desarrollo de la IA.

En 2024, la startup de inteligencia espacial del pionero de la IA e informático Feifei Li, World Labs, ha completado dos rondas de financiación con el objetivo de construir un "gran modelo mundial" y está valorada actualmente en 1.000 millones de dólares, mientras que Google DeepMind ha cazado furtivamente el modelo de generación de imágenes de OpenAI Sora Uno de los responsables de la construcción del Simulador Mundial; OpenAI también describe a Sora como un modelo del mundo.

 

什么是 AI「世界模型」?为什么李飞飞、Google、OpenAI 都纷纷投入?

¿Qué es exactamente un modelo mundial? ¿Por qué se le presta cada vez más atención?

 

Dar a la IA una comprensión del mundo real

El modelo del mundo de la IA se inspira en el modelo de la mente humana: el cerebro humano toma información de los sentidos para desarrollar una comprensión más concreta del mundo que le rodea.

En un artículo, David Ha y Jürgen Schmidhuber, investigadores de IA, ponen el ejemplo de los bateadores de béisbol que pueden golpear una bola rápida de 160 km/h porque pueden predecir "instintivamente" la dirección de la bola, y esto es razonado y ocurre subconscientemente: sus músculos batean instintivamente en el momento y lugar adecuados basándose en las predicciones del modelo cerebral. Se ha afirmado que el modelado mental es un requisito previo para la inteligencia humana.

Como sistema de IA, un modelo mundial de IA sigue el mismo camino. Según la AI startup runway, un modelo de mundo de IA puede construir pistas internas para el entorno externo y simular futuros acontecimientos ambientales basándose en esas pistas; el objetivo del modelo de mundo es simular una situación exactamente igual a la del mundo real.

 

¿Por qué los modelos mundiales están en el punto de mira?

De hecho, el concepto de modelización mundial existe desde hace más de una década, pero el Una de las razones de este creciente interés es el auge de los vídeos generados por IA. .

TechCrunch observa que la mayoría de los contenidos de vídeo generados por IA siguen sufriendo el fenómeno del Valle del Terror, como mostrar miembros retorcidos o fusionados entre sí. Además, aunque los modelos generativos de IA pueden predecir con exactitud fenómenos físicos como la dirección de un rebote de baloncesto, a pesar de años de entrenamiento con imágenes, en realidad no saben por qué rebota la pelota.

En cambio, un modelo del mundo con percepción del mundo en 3D puede mostrar mejor los efectos de un rebote de baloncesto. Para que la IA consiga esta percepción, el modelo del mundo debe entrenarse con una serie de datos, como fotos, audio, vídeo y texto.

El potencial del modelo mundial no se limita a generar vídeos. Investigadores como Likun Yang, científico jefe de IA de Meta, afirmó que En el futuro, los modelos mundiales podrán utilizarse para realizar previsiones y planificaciones complejas tanto en el ámbito digital como en el físico. Por su parte, Justin Johnson, cofundador de World Labs, afirmó que los modelos mundiales podrían en el futuro Genere mundos virtuales en 3D para juegos, fotografía virtual, etc. .

Para los desarrolladores, con un potente modelo del mundo, no hay necesidad de definir cómo se mueve cada objeto uno por uno, una tarea a menudo tediosa, engorrosa y que lleva mucho tiempo.Alex Mashrabov, ex Jefe de IA de Snap y CEO de Higgsfield, declaró a la prensa que con un modelo avanzado del mundo, la AI es capaz de desarrollar una autocomprensión de cualquier escenario en el que se encuentre y empezar a razonar sobre posibles soluciones.

 

3 muros que cruzar para modelar el mundo

Aunque el concepto de un modelo mundial es tentador, aún quedan muchos retos técnicos. En una charla en 2024, Li-Kun Yang admitió que harían falta al menos otros 10 años para hacer realidad el modelo mundial que tenía en mente.

Según el análisis de los medios de comunicación extranjeros, los obstáculos a los que se enfrenta el modelo mundial son también un microcosmos del desarrollo actual de los modelos de IA. En primer lugar. Entrenar y ejecutar modelos mundiales requiere mucha potencia aritmética --Se necesitan miles de GPU sólo para Sora, que se considera un modelo primitivo del mundo.

Además. El modelo del mundo también produce alucinaciones y pueden internalizar sesgos en los datos de entrenamiento. Por ejemplo, un modelo visual entrenado a partir de un vídeo de un día soleado en una ciudad europea puede tener dificultades para entender o representar una ciudad coreana nevada, o incluso generar contenidos incorrectos sin más.

Para abordar esta cuestión. Los datos de entrenamiento para el modelo mundial deben ser lo suficientemente amplios como para abarcar no sólo distintos escenarios, sino también lo suficientemente específicos como para que la IA comprenda los matices de los distintos escenarios. Sin embargo, el desarrollo de la IA también se enfrenta actualmente a una crisis de escasez de datos. Epoch AI predice que los desarrolladores se quedarán sin datos para entrenar modelos generativos de IA entre 2026 y 2032.

No obstante, el modelo del mundo sigue siendo muy atractivo, y Mashrabov afirma que si se superan los obstáculos, el modelo del mundo podría suponer una conexión "mucho más fuerte" entre la IA y el mundo real, un gran avance no sólo en la generación de mundos virtuales, sino también en las áreas de robótica y toma de decisiones de la IA.

 

Artículos relacionados

World Labs: Construye un modelo 3D del mundo a partir de una sola imagen, ¡solicita la prueba beta del modelo de Inteligencia Espacial!

Skybox AI: generación de imágenes panorámicas de 360° para crear fácilmente mundos virtuales

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...