Zusammenfassung: Google-Forscher haben gerade VLOGGER entwickelt, ein neues KI-Modell, das aus Standbildern und Audioclips realistische Talking-Head-Videos mit voller Oberkörperbewegung erzeugt.
Die Einzelheiten:
VLOGGER erstellt einen steuerbaren Avatar, der Ähnlichkeiten und Handlungen festhält.
Das Modell wurde auf einem großen Multimedia-Datensatz trainiert, der 800.000 Videos von sprechenden Personen enthält und für jeden Teil des Gesichts und des Körpers gekennzeichnet ist.
Mögliche Anwendungen sind die Synchronisierung von Videos in anderen Sprachen, die Erstellung realistischer Avatare für Spiele oder Assistenten und die Unterstützung von Videochats mit geringer Bandbreite.
WICHTIG: Ob es darum geht, KI-Assistenten Realismus zu verleihen, die Echtzeit-Videosynchronisation in verschiedenen Sprachen zu ermöglichen oder uns mit unseren Lieblingsavataren per Videochat zu unterhalten - Modelle wie VLOGGER sind ein faszinierender Vorgeschmack auf eine Zukunft, in der die Grenzen zwischen unserem physischen und digitalen Ich verschwimmen werden. Neue Herangehensweise.