Google выпустила новые видеоролики с искусственным интеллектом Veo2 и картографию с искусственным интеллектом Imagen3
В начале этого года Google запустила Veo, модель для создания видео, и Imagen 3, новейшую модель для создания изображений, и с тех пор было интересно наблюдать, как люди воплощают свои идеи в жизнь с помощью этих моделей: создатели YouTube исследуют творческие возможности создания видеофонов для YouTube Shorts, корпоративные клиенты улучшают свои творческие рабочие процессы с помощью Vertex AI Корпоративные клиенты улучшают свои творческие рабочие процессы с помощью Vertex AI, а творческие работники используют VideoFX ответить пением ImageFX чтобы рассказывать свои истории. Вместе с партнерами со всех сторон, от кинематографистов до корпораций, мы продолжаем развивать и совершенствовать эти технологии.
Посреди ночи OpenAI выложила персонализированный поиск ИИ после того, как их никудышный прямой эфир не смог ничего показать. Но Google, без дразнилок и маркетинга, молча выложила на X два больших результата.

Сегодня компания Google представила новую видеомодель Veo 2 и ее последнюю версию Imagen 3, которые достигли самых передовых результатов. Эти модели теперь доступны в VideoFX, ImageFX и нашем последнем экспериментальном проекте Whisk.
Veo 2: современная технология генерации видео
Veo 2 создает чрезвычайно качественные видеоролики на самые разные темы и в самых разных стилях. При сравнении с другими моделями, проведенном экспертами, Veo 2 показала лучшие результаты по сравнению с ведущими моделями.
Он позволяет лучше понять физику реального мира, а также детали движения и выражения лица человека, что способствует общему ощущению детализации и реализма. veo 2 понимает уникальный язык кинематографа: просто укажите жанр, укажите кадр, предложите кинематографический эффект, и veo 2 сделает это - в разрешении до 4K и с продолжительностью, которая может достигать нескольких минут. до нескольких минут. Попросите Veo 2 сделать трекинговую съемку сцены с низкого ракурса или крупный план ученого, смотрящего в микроскоп, и Veo 2 создаст это. Просто введите в подсказку "объектив 18 мм", и Veo 2 знает, как передать широкоугольные эффекты, характерные для этого объектива, или размыть фон, чтобы сфокусироваться на объекте, добавив в подсказку "малая глубина резкости".
Veo 2, самая продвинутая видеомодель ИИ на сегодняшний день, и Imagen 3, улучшенная версия модели рисунка ИИ. Группа из нас, глядя на результаты, не переставала восклицать, восхищаясь взрывающимися изображениями. Я почти никогда не использую слово "взрывы", но эффекты AI Video Veo 2 действительно вызвали у меня желание ликовать, даже немного, как при просмотре Соры в ту роковую ночь 16 февраля. Один за другим.
I. AI Video Veo 2
Онлайн-эффект Veo 2 не встроенный эффект



В то время как видеомодели часто "галлюцинируют" нежелательные детали - например, лишние пальцы или неожиданные объекты, - Veo 2 создает эти проблемы реже, что приводит к более реалистичному изображению. Результат - более реалистичный результат.
При разработке Veo 2 мы руководствовались принципами безопасности и ответственного подхода к разработке. Мы позаботились о расширении возможностей Veo, чтобы помочь выявить, понять и улучшить качество и безопасность модели по мере ее постепенного распространения через VideoFX, YouTube и Vertex AI.
Как и все наши модели генерации изображений и видео, результаты работы Veo 2 содержат невидимый водяной знак SynthID, который помогает идентифицировать их как контент, созданный искусственным интеллектом, снижая вероятность дезинформации и неправильного присвоения авторства.
Сегодня мы добавляем новые функции Veo 2 в инструмент генерации видео Google Labs, VideoFX, и расширяем круг доступных пользователей. Посетите Google Labs, чтобы записаться в список ожидания. В следующем году мы также планируем распространить Veo 2 на YouTube Shorts и другие продукты.
Компания Google сама провела проверку с помощью человека-наблюдателя, используя эталонный набор данных MovieGenBench, выпущенный Meta, и составила 1003 данных, чтобы люди могли вслепую проверить, какой из них работает лучше. Результаты, как они были получены, выглядели следующим образом.
Я немного поясню этот фрагмент: есть две таблицы, которые делятся на "Общее предпочтение" (Overall Preference) и "Приверженность к подсказке" (Prompt Match).
На горизонтальной оси каждого графика представлены различные сравниваемые модели: Meta, Kerin v1.5, Minimax и Sora Turbo. Google провела слепой тест Veo 2 в сравнении с этими моделями.
Действительно, отечественные модели теперь можно использовать в качестве эталона для сравнения, и внезапно возникает прилив горячей крови.
Каждый столбец состоит из трех частей, цвета которых отражают классификацию результатов:
Зеленая часть (Veo): процент выхода Veo, который рецензенты предпочли при сравнении.
Белая часть (Ties): доля рецензентов, считающих эти два варианта неразличимыми, т.е. не имеющих четкого предпочтения.
Розовая секция (Другой предпочтительнее): рецензент предпочитает пропорции другой модели (не Veo).
В привычном для Google DeepMind стиле "густых бровей", он практически ничего не подделывает, поэтому, как вы можете видеть, в большинстве случаев Google Veo 2 достигает оптимальных результатов.
А в обзоре Google самой сильной из остальных четырех моделей, кроме Veo 2, является Korin v1.5, что является довольно интересным результатом. И еще один момент.Veo 2, способный снимать видео в формате 4K.
Видео, которое они выложили на Youtube, также имеет формат 4K, и это видео довольно пугающее. Сами они говорят, что самая большая сложность и ограничение на данный момент все еще в движении.
Изначально было сказано: "Создание реалистичного, динамичного или сложного видео с полной согласованностью в сложных сценах или сценах со сложным движением остается сложной задачей".
II. AI рисунок Imagen 3
Google также усовершенствовал свою модель формирования изображений Imagen 3, которая теперь создает более яркие и скомпонованные изображения. Теперь она способна с большей точностью отображать самые разные художественные стили - от фотореализма до импрессионизма, от абстрактного искусства до аниме. Обновление также позволяет модели более точно следовать подсказкам и передавать более богатые детали и текстуры. В сравнении с ведущими моделями генерации изображений, проведенном человеческими рецензентами, Imagen 3 занял лидирующее положение.
Начиная с сегодняшнего дня, последние модели Imagen 3 будут доступны в ImageFX, инструменте для создания изображений Google Labs, в более чем 100 странах мира. Посетите ImageFX, чтобы начать работу.
Помимо Veo 2, на волне Google также была выпущена улучшенная версия модели Imagen 3 с искусственным интеллектом, которая на самом деле технически является моделью Imagen 3-002, вторым поколением Imagen 3. Первое поколение Imagen 3 было выпущено 14 мая 2024 года на конференции разработчиков Google I/O. Спустя полгода Google значительно изменила Imagen 3, выпустив улучшенную версию второго поколения, и, согласно их собственному обзору, она прямо-таки портит графики.

В настоящее время нет очереди, вы можете просто играть, и, в общем, это бесплатно.

Напишите Prompt прямо в поле ввода и начните играть.
Дизайн их Prompt, но и очень интересно, вы можете ввести различные странные и странные большой серии Prompt, он будет автоматически давать вамположение о дезамбигментацииЭто немного похоже на тот взрыв капсулы, который Лао Луо устроил в свое время, разделив некоторые слова и превратив их для вас ввыпадающее полеавтоматически ассоциируется с несколькими другими опциями.
Вот некоторые официально опубликованные рендеры





© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...