구글은 최근 동영상 생성 모델인 베오 2를 공식적으로 통합했다고 발표했습니다. 쌍둥이자리 고급 서비스와 실험적인 플랫폼인 Whisk에 적용되었습니다. 이번 조치로 Google One AI 프리미엄 가입자는 이제 텍스트 프롬프트 또는 기존 이미지에서 바로 짧은 동영상 콘텐츠를 생성할 수 있습니다.
베오 2는 텍스트 설명을 MP4 형식의 최대 8초, 720p 해상도, 16:9 화면비 동영상으로 변환할 수 있는 고급 동영상 생성 기술로 구글의 입지를 다지고 있습니다. 이 모델은 현실적인 물리 법칙과 인간 움직임에 대한 이해도가 향상되었으며, 다양한 주제와 스타일을 아우르는 부드러운 움직임, 사실적인 장면, 풍부한 디테일의 비디오 클립을 생성할 수 있다고 합니다.

Gemini에서 텍스트-비디오 생성
Gemini Advanced에서 사용자는 드롭다운 메뉴에서 Veo 2 모델을 선택하여 동영상을 만들 수 있습니다. 사용자가 장면에 대한 자세한 설명을 입력하면 Gemini가 동영상 생성을 시도하는 비교적 간단한 과정입니다. 예를 들어 공식 데모에서는 다양한 스타일의 생성을 보여줍니다:
- 장면 1: 흰색 외골격 슈트를 입은 두 인물이 거대한 빙하 동굴을 가로지르는 가운데 헬멧 조명이 빙벽에 얼어붙은 사탕 같은 물체를 비추며 천천히 움직이는 넓은 카메라가 빙하 동굴을 훑어갑니다.
- 샘플 동영상 링크: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__37_aDEwjss.mp4
- 장면 2: 대형 안경을 쓴 생쥐가 아늑한 숲속 은신처에서 빛나는 버섯 불빛을 받으며 책을 읽는 애니메이션이 스타일리시하게 펼쳐집니다.
- 샘플 동영상 링크: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Mouse_Reads_Video_Generated.mp4
- 장면 3: 풀로 덮인 절벽이 모래사장과 연결되어 있고 파도가 해안으로 밀려오고 바다에 튀어나온 바다 기둥이 일출이나 일몰의 황금빛 빛으로 물들어 있는 조감도입니다.
- 샘플 동영상 링크: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__13.mp4
- 장면 4: 맑고 푸른 하늘 아래에서 분홍색, 회색, 흰색 아이스크림이 녹는 소마토트로픽 스타일의 타임랩스입니다.
- 샘플 동영상 링크: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/KR_Veo2_4.mp4
Google은 설명이 상세할수록 사용자가 최종 동영상에 대한 통제권을 더 많이 가질 수 있다고 강조합니다. 이 기능은 개념을 빠르게 시각화하거나, 짧은 시각적 스토리를 서술하거나, 창의적인 조합을 만들 수 있는 새로운 가능성을 열어줍니다. 생성된 동영상은 공유 버튼을 통해 TikTok 또는 YouTube 쇼츠와 같은 플랫폼에 쉽게 업로드할 수 있습니다.
현재 Veo 2는 720p 해상도에서 8초 길이로 제한된 동영상을 생성하며, 이는 숏폼 동영상 플랫폼의 일부 요구 사항을 충족하거나 빠른 개념 증명을 위해 충분하지만, 업계에서 하고 있는 방식(예: OpenAI)과는 다릅니다. Sora 현재 Gemini에서 Veo 2의 사용은 더 긴 시간, 더 높은 해상도, 더 큰 내러티브 파워를 추구하는 트렌드보다는 가볍고 즉각적인 저작 환경에 더 초점을 맞추고 있는 것으로 보입니다(이 모델에서 볼 수 있듯이). 또한 이 기능에는 월별 생성 횟수 제한이 있어 헤비 유저의 창작 과정에 영향을 미칠 수 있습니다.
동영상 생성 기능은 Gemini가 지원하는 모든 언어로 Gemini 고급 웹 및 모바일 사용자에게 전 세계적으로 배포되고 있습니다.
휘젓기 애니메이션: 정지 이미지 움직이기
텍스트 생성 동영상 외에도, 구글은 사용자가 텍스트와 이미지 프롬프트를 결합하여 아이디어를 탐색하고 시각화할 수 있는 실험적인 프로젝트인 '휘스크 애니메이션'을 통해 Veo 2의 강력한 기능을 Whisk 플랫폼에 도입했습니다(작년 12월 구글 랩에서 출시).
이제 Whisk Animate를 사용하면 Google One AI 프리미엄 구독자는 자신이 만들거나 업로드한 정지 이미지를 8초 길이의 모션 동영상으로 만들 수 있습니다. 이 기능은 기존 이미지에 모션을 추가하려는 사용자에게 편리한 도구입니다. 이 기능은 현재 60개국 이상에서 사용할 수 있습니다.
- 휘스크 애니메이션 관련 소개 동영상 링크: https://www.youtube.com/watch?v=2yYDI-p5aGs (원본 링크는 썸네일, 여기에 제공된 유튜브 시청 링크 추정)
동영상 제작 기능을 Gemini와 Whisk에 통합하는 것은 AI 제작 도구를 기존 생태계와 구독 서비스에 통합하려는 Google의 전략을 보여줍니다. 이는 사용자가 고급 AI 기능에 액세스하고 사용하는 데 있어 장벽을 낮추는 동시에 특정 유료 구독과도 연결됩니다.
안전 고려 사항 및 업계의 책임
동영상 생성 기능의 출시와 함께 구글은 보안 조치에 대해서도 언급했습니다. 여기에는 정책을 위반하는 콘텐츠 생성을 방지하기 위한 광범위한 '레드 팀' 및 평가가 포함됩니다.
핵심 이니셔티브는 Veo 2에서 생성된 모든 동영상에 SynthID 디지털 워터마크가 삽입된다는 것입니다. 이 워터마크는 동영상의 모든 프레임에 삽입되도록 설계되었으며, 해당 동영상이 AI에 의해 생성되었음을 식별하는 데 사용됩니다. 진위 여부를 식별하기 어려운 AI 생성 콘텐츠의 보급이 증가하는 상황에서 신뢰할 수 있는 워터마킹 기술의 채택은 투명성을 높이고 허위 정보를 방지하는 데 매우 중요하며 책임감 있는 AI 개발의 필수 요소입니다.
Google은 또한 모든 생성형 AI 도구와 마찬가지로 Gemini의 출력은 주로 사용자 프롬프트에 의해 결정되며 경우에 따라 불쾌한 콘텐츠를 생성할 수 있음을 인정하며 지속적인 개선을 위해 사용자가 피드백 버튼을 통해 의견을 제공하도록 권장합니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...