Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3

AI-NachrichtenAktualisiert vor 9 Monaten AI-Austauschkreis

14.1K 00

Anfang dieses Jahres hat Google Veo, ein Modell zur Videogenerierung, und Imagen 3, sein neuestes Modell zur Bilderzeugung, auf den Markt gebracht. Seitdem ist es aufregend zu sehen, wie Menschen ihre Ideen mit diesen Modellen zum Leben erwecken: YouTube-Kreative erkunden die kreativen Möglichkeiten der Erstellung von Videokulissen für YouTube Shorts, Unternehmenskunden verbessern ihre kreativen Workflows mit Vertex AI Unternehmenskunden verbessern ihre kreativen Arbeitsabläufe mit Vertex AI, und Kreative nutzen VideoFX im Gesang antworten ImageFX um ihre Geschichten zu erzählen. Mit Partnern aus allen Bereichen, von Filmemachern bis zu Unternehmen, entwickeln wir diese Technologien weiter.

Mitten in der Nacht veröffentlichte OpenAI eine personalisierte KI-Suche, nachdem ihr miserabler Live-Stream nichts zu bieten hatte. Aber Google hat, ohne zu necken oder zu werben, still und leise zwei große Dinge auf X. veröffentlicht.

Heute hat Google ein neues Videomodell, Veo 2, und die neueste Version, Imagen 3, auf den Markt gebracht, die beide modernste Ergebnisse erzielen. Diese Modelle sind jetzt in VideoFX, ImageFX und unserem neuesten experimentellen Projekt Whisk verfügbar.

Veo 2: modernste Technologie zur Videoerzeugung
Veo 2 erstellt Videos in extrem hoher Qualität zu einer breiten Palette von Themen und Stilen. Bei direkten Vergleichen durch menschliche Prüfer erzielte der Veo 2 die besten Ergebnisse gegenüber führenden Modellen.

veo 2 versteht die einzigartige Sprache der Kinematografie: Geben Sie einfach ein Genre vor, legen Sie eine Einstellung fest, schlagen Sie einen filmischen Effekt vor, und veo 2 macht es - bei Auflösungen von bis zu 4K und bei Längen, die mehrere Minuten betragen können. von mehreren Minuten. Bitten Sie Veo 2 um eine Kamerafahrt über eine Szene aus einem niedrigen Winkel oder um eine Nahaufnahme eines Wissenschaftlers, der durch ein Mikroskop schaut, und Veo 2 wird es schaffen. Geben Sie einfach "18mm Objektiv" in die Eingabeaufforderung ein und Veo 2 weiß, wie man die Weitwinkeleffekte einfängt, die das Objektiv charakterisieren, oder den Hintergrund unscharf macht, um sich auf das Motiv zu konzentrieren, indem man "geringe Schärfentiefe" zur Eingabeaufforderung hinzufügt.

Veo 2, das derzeit fortschrittlichste KI-Videomodell, und Imagen 3, eine verbesserte Version des KI-Zeichenmodells. Eine Gruppe von uns, die sich die Ergebnisse ansah, rief immer wieder voller Bewunderung über die Blow-ups aus. Ich verwende fast nie das Wort "aufblasen", aber die Effekte des AI Video Veo 2 brachten mich wirklich dazu, zu jubeln, sogar ein bisschen so, als ob ich Sora in jener verhängnisvollen Nacht am 16. Februar gesehen hätte. Einer nach dem anderen.

I. AI Video Veo 2

Online-Effekt Veo 2 ungebauter Effekt

Während Videomodelle oft unerwünschte Details "halluzinieren" - wie z. B. zusätzliche Finger oder unerwartete Objekte - treten diese Probleme bei Veo 2 seltener auf, was zu einer realistischeren Ausgabe führt. Das Ergebnis ist eine realistischere Ausgabe.

Unser Engagement für Sicherheit und verantwortungsvolle Entwicklung hat uns bei der Entwicklung von Veo 2 geleitet. Wir haben darauf geachtet, die Benutzerfreundlichkeit von Veo zu erweitern, um die Qualität und Sicherheit des Modells zu erkennen, zu verstehen und zu verbessern, während es langsam über VideoFX, YouTube und Vertex AI eingeführt wird.

Wie bei allen unseren Bild- und Videogenerierungsmodellen enthält die Ausgabe von Veo 2 ein unsichtbares SynthID-Wasserzeichen, um die Identifizierung als KI-generierte Inhalte zu erleichtern und die Wahrscheinlichkeit von Fehlinformationen und falschen Zuordnungen zu verringern.

Heute stellen wir neue Veo 2-Funktionen für das Google Labs-Tool zur Videoerstellung, VideoFX, vor und erweitern den Kreis der zugänglichen Nutzer. Besuchen Sie Google Labs, um sich auf die Warteliste zu setzen. Wir planen außerdem, Veo 2 im nächsten Jahr auf YouTube Shorts und andere Produkte auszuweiten.

Google selbst hat eine Überprüfung durch menschliche Beobachter vorgenommen, und zwar mit Hilfe des von Meta veröffentlichten Benchmark-Datensatzes MovieGenBench, und 1003 Daten erstellt, um die Leute blind testen zu lassen, welcher von ihnen besser funktioniert. Die Ergebnisse, wie sie schließlich erhalten wurden, sahen wie folgt aus. Google全新发布AI视频Veo2、AI绘图Imagen3

Es gibt zwei Tabellen, die in Gesamtpräferenz (Overall Preference) und Prompt Adherence (Prompt Match) unterteilt sind.
Die horizontale Achse jedes Diagramms stellt die verschiedenen Modelle dar, die verglichen werden: Meta, Kerin v1.5, Minimax und Sora Turbo. Google hat einen blinden Punkt-zu-Punkt-Test des Veo 2 mit diesen Modellen durchgeführt.
Jetzt kann man tatsächlich einheimische Modelle als Vergleichsmaßstab heranziehen, und plötzlich gibt es einen Ansturm von heißem Blut.

Und jede Spalte besteht aus drei Teilen, wobei die Farben die Klassifizierung der Ergebnisse darstellen:
Grüner Bereich (Veo): der Prozentsatz der Veo-Ausgabe, den die Prüfer bei ihren Vergleichen bevorzugt haben.
Der weiße Teil (Unentschieden): der Anteil der Bewerter, die die beiden als ununterscheidbar betrachten, d. h. keine klare Präferenz haben.
Rosafarbener Bereich (Andere bevorzugt): Der Rezensent bevorzugt die Proportionen des anderen Modells (Nicht-Veo).

In gewohnter Google DeepMind-Manier wird im Grunde nichts gefälscht, und wie Sie sehen, erzielt Googles Veo 2 in den meisten Fällen optimale Ergebnisse.
Und in der Bewertung von Google ist das stärkste der anderen vier Modelle, abgesehen vom Veo 2, das Korin v1.5, was ein ziemlich interessantes Ergebnis ist. Und, eine Sache zu beachten.Veo 2, der 4K-Videos direkt ausgeben kann.

Die Videos, die sie auf Youtube hochgeladen haben, sind ebenfalls native 4K, und dieses hier ist ziemlich beängstigend. Sie selbst sagen, dass die größte Schwierigkeit und Einschränkung im Moment noch in der Bewegung liegt.
Die ursprüngliche Aussage lautete: "Die Erstellung realistischer, dynamischer oder komplexer Videos mit vollständiger Konsistenz über komplexe Szenen oder Szenen mit komplexer Bewegung bleibt eine Herausforderung."

II. AI Zeichnung Imagen 3

Google hat auch sein Bilderzeugungsmodell Imagen 3 verbessert, das jetzt hellere, besser komponierte Bilder erzeugt. Es ist jetzt in der Lage, eine größere Vielfalt an Kunststilen - von Fotorealismus bis Impressionismus, von abstrakter Kunst bis Anime - mit größerer Präzision darzustellen. Das Upgrade ermöglicht es dem Modell außerdem, Anhaltspunkte genauer zu verfolgen und reichhaltigere Details und Texturen darzustellen. In einem Vergleich mit führenden Bildgenerierungsmodellen, der von menschlichen Prüfern durchgeführt wurde, erreichte Imagen 3 die Spitzenposition.

Ab heute sind die neuesten Imagen 3-Modelle weltweit in ImageFX, dem Bilderzeugungstool von Google Labs, in mehr als 100 Ländern verfügbar. Besuchen Sie ImageFX, um loszulegen.

Neben dem Veo 2 hat Google auch gleich seine verbesserte Version des KI-Mapping-Modells Imagen 3 verschickt, bei dem es sich technisch gesehen um das Modell Imagen 3-002 handelt, die zweite Generation des Imagen 3. Die erste Generation von Imagen 3 wurde am 14. Mai 2024 auf Googles I/O-Entwicklerkonferenz vorgestellt. Ein halbes Jahr später hat Google das Imagen 3 erheblich weiterentwickelt und eine verbesserte Version der zweiten Generation herausgebracht, die nach eigenen Angaben die Charts geradezu abschlachtet.

Es gibt derzeit keine Warteschlange, man kann einfach spielen und, na ja, es ist kostenlos.

Schreiben Sie Prompt direkt in das Eingabefeld und starten Sie die Wiedergabe.

Das Design ihrer Prompt, sondern auch sehr interessant, können Sie eine Vielzahl von seltsamen und seltsamen eine große Reihe von Prompt geben, wird er automatisch geben SieDisambiguierungsklauselEs ist so ähnlich wie die Kapsel-Explosion, die Lao Luo damals hatte, bei der man einige der Wörter aufteilt und sie für dich inDropdown-Boxund assoziiert automatisch mehrere andere Optionen.

Hier sind einige offiziell veröffentlichte Renderings

AI-Nachrichten

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Baidu ist zur Vernunft gekommen, und die Wenshin Intelligent Body Platform wird vollen Zugang zu DeepSeek haben!

AI-Nachrichten

vor 7 Monaten

011.5K

Google veröffentlicht die Vertex AI RAG-Engine: eine zentrale Anlaufstelle für die Entwicklung zuverlässiger generativer Anwendungen mit Suchfunktionen

AI-Nachrichten

vor 8 Monaten

013.6K

德勤《行动提示：AI代理如何重塑工作的未来——生成式AI的扩展能力、用例及其对企业的影响》

Deloitte's Action Alert: Wie KI-Agenten die Zukunft der Arbeit verändern - Skalierbarkeit von generativer KI, Anwendungsfälle und ihre Auswirkungen auf das Unternehmen

AI-Nachrichten

vor 10 Monaten

013.8K

Tencent hat Zugang zu DeepSeek-R1, das kostenlos zu verwenden ist! Der Hybrid sagte: Gibt es keine Liebe?

AI-Nachrichten

vor 7 Monaten

014.2K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3

I. AI Video Veo 2

II. AI Zeichnung Imagen 3

SiliconCloud geht mit beschleunigtem Videomodell Mochi-1-Preview live

Smart Spectrum veröffentlicht ein kostenloses Vision-Modell GLM-4V-Flash Gleichzeitigkeitsgrenze auf 10 erhöht, dieses Mal genug für Produktionsumgebungen

Ähnliche Artikel

Baidu ist zur Vernunft gekommen, und die Wenshin Intelligent Body Platform wird vollen Zugang zu DeepSeek haben!

Google veröffentlicht die Vertex AI RAG-Engine: eine zentrale Anlaufstelle für die Entwicklung zuverlässiger generativer Anwendungen mit Suchfunktionen

Deloitte's Action Alert: Wie KI-Agenten die Zukunft der Arbeit verändern - Skalierbarkeit von generativer KI, Anwendungsfälle und ihre Auswirkungen auf das Unternehmen

Tencent hat Zugang zu DeepSeek-R1, das kostenlos zu verwenden ist! Der Hybrid sagte: Gibt es keine Liebe?

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

Google veröffentlicht neu AI Video Veo2, AI Mapping Imagen3

I. AI Video Veo 2

II. AI Zeichnung Imagen 3

SiliconCloud geht mit beschleunigtem Videomodell Mochi-1-Preview live

Smart Spectrum veröffentlicht ein kostenloses Vision-Modell GLM-4V-Flash Gleichzeitigkeitsgrenze auf 10 erhöht, dieses Mal genug für Produktionsumgebungen

Ähnliche Artikel

Baidu ist zur Vernunft gekommen, und die Wenshin Intelligent Body Platform wird vollen Zugang zu DeepSeek haben!

Google veröffentlicht die Vertex AI RAG-Engine: eine zentrale Anlaufstelle für die Entwicklung zuverlässiger generativer Anwendungen mit Suchfunktionen

Deloitte's Action Alert: Wie KI-Agenten die Zukunft der Arbeit verändern - Skalierbarkeit von generativer KI, Anwendungsfälle und ihre Auswirkungen auf das Unternehmen

Tencent hat Zugang zu DeepSeek-R1, das kostenlos zu verwenden ist! Der Hybrid sagte: Gibt es keine Liebe?

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel