Google Veo 2 Video Generation приходит на Gemini и Whisk, расширяя территорию применения инструментов искусственного интеллекта

Новости ИИОпубликовано 4 месяца назад Круг обмена ИИ
5.7K 00

Недавно компания Google объявила, что ее модель генерации видео, Veo 2, была официально интегрирована в Близнецы Advanced и в экспериментальной платформе Whisk. Теперь подписчики Google One AI Premium могут генерировать короткие видеоматериалы прямо из текстовых подсказок или существующих изображений.

Veo 2 позиционируется Google как передовая технология генерации видео, предназначенная для преобразования текстовых описаний в 8-секундные видеоролики с разрешением 720p и соотношением сторон 16:9 в формате MP4. Модель, как утверждается, усовершенствована с точки зрения понимания законов реалистичной физики и человеческого движения, и способна генерировать видеоролики с плавными движениями, реалистичными сценами и богатой детализацией, охватывая широкий спектр тем и стилей.

谷歌 Veo 2 视频生成登陆 Gemini 与 Whisk,AI 创作工具版图再扩张

 

Генерация текста в видео в Gemini

В Gemini Advanced пользователь может создать видео, выбрав модель Veo 2 из выпадающего меню. Процесс относительно прост: пользователь вводит подробное описание сцены, а Gemini пытается сгенерировать видео. В официальной демонстрации показаны различные стили генерации, например:

  • Сцена первая: Широкая, медленно движущаяся камера охватывает огромную ледниковую пещеру, по которой идут две фигуры в белых экзоскелетных костюмах, а фонари на шлемах освещают застывшие, похожие на конфеты предметы в ледяных стенах.
    • Ссылка на пример видео: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__37_aDEwjss.mp4
  • Сцена вторая: Анимированная мышь в огромных очках читает книги при свете светящихся грибов в уютной лесной берлоге.
    • Ссылка на пример видео: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Mouse_Reads_Video_Generated.mp4
  • Сцена третья: Вид с воздуха на покрытые травой скалы, соединяющиеся с песчаным пляжем, с волнами, бьющимися о берег, и выступающим морским столбом, стоящим в море, залитом золотым сиянием восхода или заката.
    • Ссылка на пример видео: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__13.mp4
  • Сцена четвертая: Таймлапс розового, серого и белого мороженого, тающего под ясным голубым небом, в соматотропном стиле.
    • Ссылка на пример видео: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/KR_Veo2_4.mp4

Google подчеркивает, что чем подробнее описание, тем больше контроля у пользователя над конечным видео. Эта функция открывает новые возможности для быстрой визуализации концепций, рассказа коротких визуальных историй или создания творческих комбинаций. Созданные видеоролики можно легко загрузить на такие платформы, как TikTok или YouTube Shorts, с помощью кнопки "Поделиться".

Стоит отметить, что Veo 2 в настоящее время генерирует видео длиной не более 8 секунд в разрешении 720p, и хотя этого достаточно для удовлетворения некоторых потребностей платформ короткого видео или для быстрой проверки концепций, это не то же самое, что делает индустрия (например, OpenAI), но это не то же самое, что делает индустрия. Сора Текущее использование Veo 2 в Gemini, по-видимому, в большей степени ориентировано на легкий и мгновенный авторский опыт, чем на тенденцию к увеличению продолжительности, повышению разрешения и силы повествования (как показано в модели). Кроме того, функция имеет месячный лимит генерации, что может повлиять на творческий процесс для опытных пользователей.

Функция генерации видео распространяется по всему миру среди веб- и мобильных пользователей Gemini Advanced на всех языках, поддерживаемых Gemini.

 

Whisk Animate: заставляем неподвижные изображения двигаться

Помимо текстового видео, Google также использует возможности Veo 2 для платформы Whisk с помощью Whisk Animate - экспериментального проекта, запущенного Google Labs в декабре прошлого года, который позволяет пользователям исследовать и визуализировать идеи, комбинируя текст и изображения.

Теперь с помощью Whisk Animate подписчики Google One AI Premium могут превратить созданные или загруженные ими неподвижные изображения в 8-секундные видеоролики с движением. Это удобный инструмент для тех, кто хочет добавить движение к своим существующим изображениям. В настоящее время эта функция доступна в более чем 60 странах.

  • Ссылка на ознакомительный ролик, связанный с Whisk Animate: https://www.youtube.com/watch?v=2yYDI-p5aGs (оригинальная ссылка - миниатюра, предполагаемая ссылка для просмотра на YouTube приведена здесь)

Интеграция возможностей создания видео в Gemini и Whisk демонстрирует стратегию Google, направленную на интеграцию средств создания ИИ в существующую экосистему и сервисы подписки. Это снижает барьер для доступа пользователей к расширенным возможностям ИИ и их использования, но при этом привязывает их к конкретным платным подпискам.

 

Соображения безопасности и ответственность промышленности

Вместе с запуском функции генерации видео Google также упомянул о принятых мерах безопасности. Они включают в себя обширную "красную команду" и оценку для предотвращения создания контента, нарушающего политику компании.

Ключевая инициатива заключается в том, что все видео, созданные Veo 2, будут снабжены цифровым водяным знаком SynthID. Этот водяной знак встраивается в каждый кадр видео и используется для идентификации того, что видео было создано искусственным интеллектом. На фоне растущей распространенности контента, созданного ИИ, подлинность которого трудно определить, внедрение надежной технологии водяных знаков имеет решающее значение для повышения прозрачности и борьбы с дезинформацией, а также является неотъемлемой частью ответственного развития ИИ.

Google также признает, что, как и все инструменты генеративного ИИ, результаты работы Gemini в значительной степени диктуются подсказками пользователя, в некоторых случаях может генерироваться нежелательный контент, и призывает пользователей предоставлять информацию через кнопку обратной связи для постоянного совершенствования.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...