AI Personal Learning
und praktische Anleitung

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3

Anfang dieses Jahres hat Google Veo, ein Modell zur Videogenerierung, und Imagen 3, sein neuestes Modell zur Bilderzeugung, auf den Markt gebracht. Seitdem ist es aufregend zu sehen, wie Menschen ihre Ideen mit diesen Modellen zum Leben erwecken: YouTube-Kreative erkunden die kreativen Möglichkeiten der Erstellung von Videokulissen für YouTube Shorts, Unternehmenskunden verbessern ihre kreativen Workflows mit Vertex AI Unternehmenskunden verbessern ihre kreativen Arbeitsabläufe mit Vertex AI, und Kreative nutzen VideoFX im Gesang antworten ImageFX um ihre Geschichten zu erzählen. Mit Partnern aus allen Bereichen, von Filmemachern bis zu Unternehmen, entwickeln wir diese Technologien weiter.

Mitten in der Nacht postete OpenAI eine personalisierte KI-Suche, nachdem ihr miserabler Live-Stream nichts zu bieten hatte. Aber Google hat, ohne zu necken oder zu werben, still und leise zwei große Dinge auf X. veröffentlicht.


Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Heute hat Google ein neues Videomodell, Veo 2, und die neueste Version, Imagen 3, auf den Markt gebracht, die beide modernste Ergebnisse erzielen. Diese Modelle sind jetzt in VideoFX, ImageFX und unserem neuesten experimentellen Projekt Whisk verfügbar.

Veo 2: Modernste Technologie zur Videoerzeugung
Veo 2 erstellt Videos in extrem hoher Qualität zu einer breiten Palette von Themen und Stilen. Bei direkten Vergleichen durch menschliche Prüfer erzielte Veo 2 die besten Ergebnisse gegenüber führenden Modellen.

veo 2 versteht die einzigartige Sprache der Kinematografie: Geben Sie einfach ein Genre vor, legen Sie eine Einstellung fest, schlagen Sie einen filmischen Effekt vor, und veo 2 macht es - bei Auflösungen von bis zu 4K und bei Längen, die mehrere Minuten betragen können. von mehreren Minuten. Bitten Sie Veo 2 um eine Kamerafahrt über eine Szene aus einem niedrigen Winkel oder um eine Nahaufnahme eines Wissenschaftlers, der durch ein Mikroskop schaut, und Veo 2 wird es schaffen. Geben Sie einfach "18mm Objektiv" in die Eingabeaufforderung ein und Veo 2 weiß, wie man die Weitwinkeleffekte einfängt, die das Objektiv charakterisieren, oder den Hintergrund unscharf macht, um sich auf das Motiv zu konzentrieren, indem man "geringe Schärfentiefe" zur Eingabeaufforderung hinzufügt.

 

Veo 2, das derzeit fortschrittlichste KI-Videomodell, und Imagen 3, eine verbesserte Version des KI-Zeichenmodells. Eine Gruppe von uns, die sich die Ergebnisse ansah, rief immer wieder voller Bewunderung über die Vergrößerung aus. Ich verwende fast nie das Wort "aufblasen", aber die Effekte des AI Video Veo 2 brachten mich wirklich dazu, zu jubeln, sogar ein bisschen so, als ob ich Sora in jener verhängnisvollen Nacht am 16. Februar gesehen hätte. Einer nach dem anderen.

 

I. AI Video Veo 2

Online-Effekt Veo 2 ungebauter Effekt

 

 

 

Während Videomodelle oft unerwünschte Details "halluzinieren" - wie z. B. zusätzliche Finger oder unerwartete Objekte - treten diese Probleme bei Veo 2 seltener auf, was zu einer realistischeren Ausgabe führt. Das Ergebnis ist eine realistischere Ausgabe.

Unser Engagement für Sicherheit und verantwortungsvolle Entwicklung hat uns bei der Entwicklung von Veo 2 geleitet. Wir haben darauf geachtet, die Benutzerfreundlichkeit von Veo zu erweitern, um die Qualität und Sicherheit des Modells zu erkennen, zu verstehen und zu verbessern, während es langsam über VideoFX, YouTube und Vertex AI eingeführt wird.

Wie bei allen unseren Bild- und Videogenerierungsmodellen enthält die Ausgabe von Veo 2 ein unsichtbares SynthID-Wasserzeichen, um die Identifizierung als KI-generierte Inhalte zu erleichtern und die Wahrscheinlichkeit von Fehlinformationen und falschen Zuordnungen zu verringern.

Heute stellen wir neue Veo 2-Funktionen für das Google Labs-Tool zur Videoerstellung, VideoFX, vor und erweitern den Kreis der zugänglichen Nutzer. Besuchen Sie Google Labs, um sich auf die Warteliste zu setzen. Wir planen außerdem, Veo 2 im nächsten Jahr auf YouTube Shorts und andere Produkte auszuweiten.

 

Google selbst hat eine Überprüfung durch menschliche Beobachter vorgenommen, und zwar mit Hilfe des von Meta veröffentlichten Benchmark-Datensatzes MovieGenBench, und 1003 Daten erstellt, um die Leute blind testen zu lassen, welcher von ihnen besser funktioniert. Die Ergebnisse, wie sie schließlich erhalten wurden, sahen wie folgt aus. Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Es gibt zwei Tabellen, die in Gesamtpräferenz (Overall Preference) und Prompt Adherence (Prompt Match) unterteilt sind.
Die horizontale Achse jedes Diagramms stellt die verschiedenen Modelle dar, die verglichen werden: Meta, Kerin v1.5, Minimax und Sora Turbo. Google hat einen blinden Punkt-zu-Punkt-Test des Veo 2 mit diesen Modellen durchgeführt.
Jetzt kann man tatsächlich einheimische Modelle als Vergleichsmaßstab heranziehen, und plötzlich gibt es einen Ansturm von heißem Blut.

Und jede Spalte besteht aus drei Teilen, wobei die Farben die Klassifizierung der Ergebnisse darstellen:
Grüner Bereich (Veo): der Prozentsatz der Veo-Ausgabe, den die Prüfer bei ihren Vergleichen bevorzugt haben.
Der weiße Teil (Unentschieden): der Anteil der Bewerter, die die beiden als ununterscheidbar betrachten, d. h. keine klare Präferenz haben.
Rosafarbener Bereich (Andere bevorzugt): Der Rezensent bevorzugt die Proportionen des anderen Modells (Nicht-Veo).

In gewohnter Google DeepMind-Manier wird im Grunde nichts gefälscht, und wie Sie sehen, erzielt Googles Veo 2 in den meisten Fällen optimale Ergebnisse.
Und in der Bewertung von Google ist das stärkste der anderen vier Modelle, abgesehen vom Veo 2, das Korin v1.5, was ein ziemlich interessantes Ergebnis ist. Und, eine Sache zu beachten.Veo 2, der 4K-Videos direkt ausgeben kann.

Die Videos, die sie auf Youtube hochgeladen haben, sind ebenfalls native 4K, und dieses hier ist ziemlich beängstigend. Sie selbst sagen, dass die größte Schwierigkeit und Einschränkung im Moment noch in der Bewegung liegt.
Die ursprüngliche Aussage lautete: "Die Erstellung realistischer, dynamischer oder komplexer Videos mit vollständiger Konsistenz über komplexe Szenen oder Szenen mit komplexer Bewegung bleibt eine Herausforderung."

 

II. AI Zeichnung Imagen 3

Google hat auch sein Bilderzeugungsmodell Imagen 3 verbessert, das jetzt hellere, besser komponierte Bilder erzeugt. Es ist jetzt in der Lage, eine größere Vielfalt an Kunststilen - von Fotorealismus bis Impressionismus, von abstrakter Kunst bis Anime - mit größerer Präzision darzustellen. Das Upgrade ermöglicht es dem Modell außerdem, Hinweisen genauer zu folgen und reichhaltigere Details und Texturen darzustellen. In Vergleichen mit führenden Bildgenerierungsmodellen, die von menschlichen Prüfern durchgeführt wurden, erreichte Imagen 3 die Spitzenposition.

Ab heute sind die neuesten Imagen 3-Modelle weltweit in ImageFX, dem Bilderzeugungstool von Google Labs, in mehr als 100 Ländern verfügbar. Besuchen Sie ImageFX, um loszulegen.

 

Neben dem Veo 2 hat Google auch gleich seine verbesserte Version des KI-Mapping-Modells Imagen 3 verschickt, bei dem es sich technisch gesehen um das Modell Imagen 3-002 handelt, die zweite Generation des Imagen 3. Die erste Generation von Imagen 3 wurde am 14. Mai 2024 auf Googles I/O-Entwicklerkonferenz vorgestellt. Ein halbes Jahr später hat Google das Imagen 3 erheblich weiterentwickelt und eine verbesserte Version der zweiten Generation herausgebracht, die nach eigenen Angaben die Charts geradezu abschlachtet.

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Es gibt derzeit keine Warteschlange, man kann einfach spielen und, na ja, es ist kostenlos.

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Schreiben Sie Prompt direkt in das Eingabefeld und starten Sie die Wiedergabe.

Das Design ihrer Prompt, sondern auch sehr interessant, können Sie eine Vielzahl von seltsamen und seltsamen eine große Reihe von Prompt geben, wird er automatisch geben SieDisambiguierungsklauselEs ist ein bisschen wie die Kapsel-Explosion, die Lao Luo damals hatte, bei der man einige Wörter aufspaltet und sie inDropdown-Boxund assoziiert automatisch mehrere andere Optionen.

 

Hier sind einige offiziell veröffentlichte Renderings

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

 

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3-1

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)