Что такое "модель мира" ИИ? Почему Фей-Фей Ли, Google и OpenAI вкладывают в нее деньги?
Разработка моделей ИИ становится все более разнообразной. Помимо крупномасштабных и мелкомасштабных языковых моделей, одним из следующих ключевых направлений развития ИИ считаются "модели мира", которые называют симуляторами мира.
В 2024 году компания World Labs, занимающаяся разработкой пространственного интеллекта, пионер ИИ и ученый-компьютерщик Фейфей Ли провела два раунда финансирования с целью создания "большой модели мира" и в настоящее время оценивается в 1 миллиард долларов, а Google DeepMind перехватила у OpenAI модель генерации изображений. Сора Один из людей, ответственных за создание симулятора мира; OpenAI также описывает Сору как модель мира.

Что такое модель мира? Почему ей уделяется все больше внимания?
Обеспечение понимания ИИ реального мира
Модель мира ИИ вдохновлена моделью человеческого разума - человеческий мозг получает информацию от органов чувств, чтобы выработать более конкретное понимание окружающего мира.
В своей работе исследователи ИИ Дэвид Ха и Юрген Шмидхубер приводят пример бейсболистов, которые могут отбить мяч со скоростью 100 миль в час, потому что они "инстинктивно" предсказывают направление полета мяча, и это происходит на подсознательном уровне - их мышцы инстинктивно замахиваются битой в нужное время и в нужном месте, основываясь на предсказаниях модели мозга. Утверждается, что мысленное моделирование является необходимым условием для человеческого интеллекта.
Как система ИИ, модель мира ИИ следует тому же пути. Как утверждают стартапы, модель мира ИИ может создавать внутренние подсказки для внешней среды и моделировать будущие события на основе этих подсказок; цель модели мира - смоделировать ситуацию в точности как в реальном мире.
Почему мировые модели находятся в центре внимания?
На самом деле, концепция моделирования мира существует уже более десяти лет, но Одной из причин такого растущего интереса является появление видео, созданных искусственным интеллектом. .
TechCrunch отмечает, что большинство видеоконтента, сгенерированного ИИ, сегодня все еще страдает от феномена "Долины ужаса", например, конечности выглядят скрученными или сросшимися друг с другом. Кроме того, хотя генеративные модели ИИ могут точно предсказывать физические явления, такие как направление отскока баскетбольного мяча, несмотря на годы обучения изображений, они не знают, почему баскетбольный мяч отскакивает.
Напротив, модель мира с трехмерным восприятием мира может лучше показать эффект отскока баскетбольного мяча. Для того чтобы ИИ смог достичь такого понимания, модель мира должна быть обучена на различных данных, включая фотографии, аудио, видео и текст.
Потенциал модели мира не ограничивается созданием видеороликов. Исследователи, такие как ведущий научный сотрудник Meta по искусственному интеллекту Ликун Янг, говорят, что Модели мира могут быть использованы в будущем для комплексного прогнозирования и планирования как в цифровой, так и в физической сферах Джастин Джонсон, соучредитель компании World Labs, в свою очередь, заявил, что в будущем модели мира могут Создавайте виртуальные 3D-миры для игр, виртуальной фотографии и т.д. .
Для разработчиков, обладающих мощной моделью мира, нет необходимости определять, как каждый объект движется по очереди - зачастую это скучная, громоздкая и отнимающая много времени задача. Алекс Машрабов, бывший руководитель отдела искусственного интеллекта в Snap и генеральный директор Higgsfield, рассказал журналистам, что благодаря продвинутой модели мира ИИ способен самостоятельно понять любой сценарий, в котором он оказался, и начать рассуждать о возможных решениях.
3 стены, которые нужно преодолеть для моделирования мира
Несмотря на то что концепция модели мира выглядит заманчиво, существует множество технических проблем. Выступая на выставке 2024, Ли-Кун Янг признался, что для реализации задуманной им модели мира потребуется еще как минимум 10 лет.
Согласно анализу зарубежных СМИ, препятствия, с которыми столкнулась мировая модель, также являются микрокосмом текущего развития моделей ИИ. Во-первых. Для обучения и запуска моделей мира требуется много арифметических действий. -Тысячи графических процессоров требуются только для Sora, которая считается ранней моделью мира.
Кроме того. Модель мира также вызывает галлюцинации и может заложить предубеждения в обучающие данные. Например, визуальная модель, обученная на основе видео солнечного дня в европейском городе, может с трудом понять или представить заснеженный корейский город или даже сгенерировать неверный контент.
Чтобы решить эту проблему. Обучающие данные для мировой модели должны быть достаточно широкими, чтобы охватить не только различные сценарии, но и достаточно специфичными, чтобы ИИ мог понять нюансы различных сценариев. Однако в настоящее время разработка ИИ также сталкивается с кризисом нехватки данных. Однако в настоящее время разработка ИИ также сталкивается с кризисом нехватки данных: по прогнозам Epoch AI, в период с 2026 по 2032 год у разработчиков закончатся данные для обучения генеративных моделей ИИ.
Тем не менее, модель мира все еще очень привлекательна, и Машрабов говорит, что если препятствия будут преодолены, модель мира может стать "гораздо более сильной" связью между ИИ и реальным миром - прорыв не только в создании виртуальных миров, но и серьезные достижения в области робототехники и принятия решений ИИ.
Похожие товары
Skybox AI: генерация панорамных изображений 360° для легкого создания виртуальных миров
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...