요약: Google 연구원들이 정지 이미지와 오디오 클립만으로 상체 움직임이 모두 포함된 사실적인 토킹 헤드 동영상을 생성하는 새로운 AI 모델인 VLOGGER를 개발했습니다.

자세한 내용:
블로거는 유사점과 행동을 포착하는 제어 가능한 아바타를 생성합니다.
이 모델은 얼굴과 몸의 각 부위별로 레이블이 지정된 80만 개의 사람 말하기 동영상이 포함된 대규모 멀티미디어 데이터 세트를 학습했습니다.
다른 언어로 된 동영상 더빙, 게임이나 어시스턴트를 위한 사실적인 아바타 만들기, 저대역폭 화상 채팅 지원 등이 잠재적인 응용 분야입니다.
중요: AI 비서에게 현실감을 제공하고, 여러 언어에 걸쳐 실시간 비디오 더빙을 가능하게 하며, 좋아하는 아바타로 화상 채팅을 할 수 있게 하는 등, 블로거와 같은 모델은 우리의 물리적 자아와 디지털 자아 사이의 경계가 모호해질 미래를 흥미롭게 예고하고 있습니다. 새로운 접근 방식.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...