La generación de vídeo Veo 2 de Google llega a Gemini y Whisk, ampliando el territorio de las herramientas de creación de IA

Google ha anunciado recientemente que su modelo de generación de vídeo, Veo 2, se ha integrado oficialmente en la Géminis Advanced y en su plataforma experimental Whisk. Los suscriptores de Google One AI Premium ya pueden generar vídeos cortos directamente a partir de mensajes de texto o imágenes existentes.

Google presenta Veo 2 como su tecnología avanzada de generación de vídeo diseñada para convertir descripciones de texto en vídeos de hasta 8 segundos, resolución 720p y relación de aspecto 16:9 en formato MP4. Se dice que el modelo está mejorado en cuanto a la comprensión de las leyes de la física realista y el movimiento humano, y es capaz de generar videoclips con movimientos suaves, escenas realistas y ricos en detalles, cubriendo una diversa gama de temas y estilos.

谷歌 Veo 2 视频生成登陆 Gemini 与 Whisk,AI 创作工具版图再扩张

 

Generación de texto a vídeo en Gemini

En Gemini Advanced, el usuario puede crear un vídeo seleccionando el modelo Veo 2 en un menú desplegable. El proceso es relativamente sencillo: el usuario introduce una descripción detallada de la escena y Gemini intenta generar un vídeo. La demostración oficial muestra diferentes estilos de generación, por ejemplo:

  • Escena uno: Una cámara amplia y de movimiento lento recorre una enorme caverna glaciar mientras dos figuras con trajes de exoesqueleto blanco caminan por ella, con las luces de los cascos iluminando objetos congelados, como caramelos, en las paredes de hielo.
    • Enlace al vídeo de muestra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__37_aDEwjss.mp4
  • Escena dos: Animado con estilo, un ratón con gafas sobredimensionadas lee libros a la luz de setas incandescentes en una acogedora guarida del bosque.
    • Enlace al vídeo de muestra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Mouse_Reads_Video_Generated.mp4
  • Escena tres: Vista aérea de unos acantilados cubiertos de hierba que conectan con una playa de arena, con las olas rompiendo en la orilla y un pilar marino que sobresale en el mar, bañado por el resplandor dorado del amanecer o el atardecer.
    • Enlace al vídeo de muestra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__13.mp4
  • Escena cuatro: Lapso de tiempo al estilo somatotrópico de un helado rosa, gris y blanco derritiéndose bajo un cielo azul despejado.
    • Enlace al vídeo de muestra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/KR_Veo2_4.mp4

Google destaca que cuanto más detallada sea la descripción, más control tendrá el usuario sobre el vídeo final. Esta función abre nuevas posibilidades para visualizar rápidamente conceptos, narrar breves historias visuales o hacer combinaciones creativas. Los vídeos generados pueden subirse fácilmente a plataformas como TikTok o YouTube Shorts a través del botón de compartir.

Cabe señalar que Veo 2 genera actualmente vídeos de una duración limitada a 8 segundos a una resolución de 720p, y aunque esto es suficiente para satisfacer algunas de las necesidades de las plataformas de vídeo de formato corto o para pruebas de concepto rápidas, no es lo mismo que lo que está haciendo la industria (por ejemplo, OpenAI). Sora El uso actual de Veo 2 en Gemini parece estar más centrado en una experiencia de creación ligera e instantánea que en la tendencia hacia duraciones más largas, resoluciones más altas y mayor poder narrativo (como demuestra el modelo). Además, la función tiene un límite de generación mensual, lo que puede afectar al proceso creativo de los usuarios intensivos.

La función de generación de vídeo se está extendiendo globalmente a los usuarios de Gemini Advanced web y móvil en todos los idiomas soportados por Gemini.

 

Whisk Animate: imágenes fijas con movimiento

Además del vídeo generado por texto, Google también está llevando la potencia de Veo 2 a la plataforma Whisk con Whisk Animate, un proyecto experimental lanzado por Google Labs el pasado diciembre que permite a los usuarios explorar y visualizar ideas combinando indicaciones de texto e imágenes.

Ahora, con Whisk Animate, los suscriptores de Google One AI Premium pueden convertir imágenes fijas que hayan creado o subido en vídeos animados de 8 segundos. Se trata de una herramienta muy útil para quienes deseen añadir movimiento a sus imágenes. Esta función está disponible actualmente en más de 60 países.

  • Enlace al vídeo introductorio relacionado con Whisk Animate: https://www.youtube.com/watch?v=2yYDI-p5aGs (el enlace original es una miniatura, aquí se proporciona el supuesto enlace de visualización de YouTube)

La integración de las capacidades de generación de vídeo en Gemini y Whisk muestra la estrategia de Google de buscar la integración de las herramientas de creación de IA en su ecosistema y servicios de suscripción existentes. Esto reduce la barrera para que los usuarios accedan y utilicen las capacidades avanzadas de IA, pero también las vincula a suscripciones de pago específicas.

 

Consideraciones de seguridad y responsabilidad del sector

Junto con el lanzamiento de la función de generación de vídeo, Google también mencionó las medidas de seguridad que ha adoptado. Esto incluye un amplio "Red Teaming" y una evaluación para evitar la generación de contenidos que infrinjan sus políticas.

Una iniciativa clave es que todos los vídeos generados por Veo 2 llevarán incrustada una marca de agua digital SynthID. Esta marca de agua está diseñada para incrustarse en cada fotograma del vídeo y se utiliza para identificar que el vídeo ha sido generado por IA. Ante la creciente prevalencia de los contenidos generados por IA, cuya autenticidad es difícil de discernir, la adopción de una tecnología fiable de marcas de agua es fundamental para mejorar la transparencia y combatir la desinformación, y forma parte integrante del desarrollo responsable de la IA.

Google también reconoce que, como todas las herramientas de IA generativa, el resultado de Gemini viene dictado en gran medida por las indicaciones del usuario, puede generar contenido censurable en algunos casos y anima a los usuarios a proporcionar información a través del botón de comentarios para una mejora continua.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...