Google lance la vidéo d'IA Veo2 et la cartographie d'IA Imagen3

Nouvelles de l'IAMise à jour il y a 9 mois Cercle de partage de l'IA

14.1K 00

Au début de l'année, Google a lancé Veo, un modèle de génération vidéo, et Imagen 3, son tout dernier modèle de génération d'images. Depuis, il est passionnant de voir les gens donner vie à leurs idées grâce à ces modèles : les créateurs de YouTube explorent les possibilités créatives de la création de toiles de fond vidéo pour YouTube Shorts, les entreprises clientes améliorent leurs flux de travail créatifs grâce à Vertex AI, et les créatifs utilisent Vertex AI pour créer leurs propres images. Les entreprises clientes améliorent leurs flux de travail créatifs grâce à Vertex AI, et les créatifs utilisent les modèles de l'IA de Vertex. VideoFX répondre en chantant ImageFX pour raconter leurs histoires. Avec des partenaires de tous bords, des cinéastes aux entreprises, nous continuons à développer et à faire évoluer ces technologies.

Au milieu de la nuit, OpenAI a publié une recherche personnalisée sur l'IA, après que son flux en direct n'ait rien donné. Mais Google, sans teasing ni marketing, a silencieusement mis en ligne deux grands projets sur X.

Aujourd'hui, Google a lancé un nouveau modèle vidéo, Veo 2, et sa dernière version, Imagen 3, qui permettent tous deux d'obtenir des résultats de pointe. Ces modèles sont désormais disponibles dans VideoFX, ImageFX et dans notre dernier projet expérimental Whisk.

Veo 2 : une technologie de génération vidéo de pointe
Veo 2 crée des vidéos de très haute qualité sur un large éventail de sujets et de styles. Lors de comparaisons directes effectuées par des évaluateurs humains, Veo 2 a obtenu des résultats de pointe par rapport aux principaux modèles.

Il apporte une meilleure compréhension de la physique du monde réel, ainsi que des détails des mouvements et des expressions humaines, ce qui contribue à un sens global du détail et du réalisme. veo 2 comprend le langage unique de la cinématographie : il suffit de fournir un genre, de spécifier un plan, de suggérer un effet cinématographique, et veo 2 le fait - à des résolutions allant jusqu'à 4K, et à des durées qui peuvent s'étendre jusqu'à plusieurs minutes. plusieurs minutes. Demandez-lui de réaliser un travelling sur une scène en contre-plongée ou un gros plan d'un scientifique au microscope, et Veo 2 s'en chargera. Il suffit de taper " objectif 18 mm " dans l'invite pour que Veo 2 sache comment capturer les effets grand angle qui caractérisent l'objectif, ou flouter l'arrière-plan pour se concentrer sur le sujet en ajoutant " faible profondeur de champ " à l'invite.

Veo 2, le modèle vidéo d'IA le plus avancé disponible aujourd'hui, et Imagen 3, une version améliorée du modèle de dessin d'IA. En regardant les résultats, un groupe d'entre nous n'a cessé de s'exclamer d'admiration devant les agrandissements. Je n'utilise presque jamais le mot "gonfler", mais les effets de l'IA Video Veo 2 m'ont vraiment donné envie d'applaudir, un peu comme lorsque j'ai regardé Sora lors de cette nuit fatidique du 16 février. Un par un.

I. Vidéo AI Veo 2

Effet en ligne Veo 2 effet non construit

Alors que les modèles vidéo "hallucinent" souvent des détails indésirables - tels que des doigts supplémentaires ou des objets inattendus - Veo 2 produit ces problèmes moins fréquemment, ce qui se traduit par un résultat plus réaliste. Il en résulte un résultat plus réaliste.

Notre engagement en faveur de la sécurité et du développement responsable a guidé la conception de Veo 2. Nous avons pris soin d'étendre la convivialité de Veo pour aider à identifier, comprendre et améliorer la qualité et la sécurité du modèle au fur et à mesure de son déploiement par le biais de VideoFX, YouTube et Vertex AI.

Comme tous nos modèles de génération d'images et de vidéos, la sortie de Veo 2 contient un filigrane SynthID invisible qui permet d'identifier le contenu généré par l'IA, réduisant ainsi la probabilité de désinformation et d'attribution erronée.

Aujourd'hui, nous intégrons de nouvelles fonctionnalités de Veo 2 à VideoFX, l'outil de génération de vidéos de Google Labs, et nous élargissons la gamme des utilisateurs accessibles. Rendez-vous sur le site Google Labs pour vous inscrire sur la liste d'attente. Nous prévoyons également d'étendre Veo 2 à YouTube Shorts et à d'autres produits l'année prochaine.

Google a procédé lui-même à un examen par un observateur humain, en utilisant l'ensemble de données de référence MovieGenBench publié par Meta, et a créé 1003 données pour permettre aux gens de tester à l'aveugle laquelle fonctionne le mieux. Les résultats, tels qu'ils ont finalement été obtenus, ressemblent à ceci. Google全新发布AI视频Veo2、AI绘图Imagen3

Il y a deux tableaux qui sont divisés en deux parties : la préférence générale (Overall Preference) et l'adhésion à l'invitation (Prompt Match).
L'axe horizontal de chaque graphique représente les différents modèles comparés, à savoir Meta, Kerin v1.5, Minimax et Sora Turbo. Google a procédé à un test point à point en aveugle de la Veo 2 par rapport à ces modèles.
Les modèles nationaux peuvent réellement servir de référence pour les comparaisons, et mon cœur se met soudain à battre la chamade.

Chaque colonne se compose de trois parties, les couleurs représentant la classification des résultats :
Section verte (Veo) : pourcentage de la production Veo que les évaluateurs ont préféré dans leurs comparaisons.
La partie blanche (égalité) : la proportion d'évaluateurs qui considèrent que les deux sont indiscernables, c'est-à-dire qu'il n'y a pas de préférence claire.
Section rose (Autres préférences) : l'auteur de l'évaluation préfère les proportions de l'autre modèle (non-Veo).

Dans le style habituel de Google DeepMind, il ne falsifie rien. Comme vous pouvez le constater, Veo 2 de Google obtient des résultats optimaux dans la plupart des cas.
Et dans l'évaluation de Google, le plus fort des quatre autres modèles, à l'exception du Veo 2, est le Korin v1.5, ce qui est un résultat assez intéressant. Une chose à noter.Veo 2, qui est capable de produire des vidéos 4K en direct.

Les vidéos qu'ils ont téléchargées sur Youtube sont également en 4K native, et celle-ci est assez effrayante. Ils disent eux-mêmes que la plus grande difficulté et la plus grande limitation pour l'instant se situe encore au niveau du mouvement.
La déclaration initiale était la suivante : "La création de vidéos réalistes, dynamiques ou complexes avec une cohérence totale dans des scènes complexes ou des scènes avec des mouvements complexes reste un défi".

II. Dessin AI Imagen 3

Google a également amélioré son modèle de génération d'images Imagen 3, qui produit désormais des images plus lumineuses et mieux composées. Il est désormais capable de restituer une plus grande variété de styles artistiques - du photoréalisme à l'impressionnisme, de l'art abstrait à l'anime - avec une plus grande précision. La mise à jour permet également au modèle de suivre plus fidèlement les indices et de rendre des détails et des textures plus riches. Dans une comparaison avec les principaux modèles de génération d'images menée par des évaluateurs humains, Imagen 3 a atteint l'état de l'art.

À partir d'aujourd'hui, les derniers modèles Imagen 3 seront disponibles dans ImageFX, l'outil de génération d'images de Google Labs, dans plus de 100 pays. Visitez ImageFX pour commencer.

Outre le Veo 2, Google a également envoyé directement sa version améliorée du modèle de cartographie IA Imagen 3, qui est en fait techniquement le modèle Imagen 3-002, la deuxième génération d'Imagen 3. La première génération d'Imagen 3 a été lancée le 14 mai 2024, lors de la conférence des développeurs I/O de Google. Six mois plus tard, Google a fait évoluer l'Imagen 3 de manière significative, en publiant une version améliorée de la deuxième génération.

Il n'y a actuellement pas de file d'attente, vous pouvez simplement jouer et, en plus, c'est gratuit.

Écrivez Prompt directement dans le champ de saisie et commencez à jouer.

La conception de leurs invites, mais aussi très intéressante, vous pouvez entrer une variété d'étranges et de bizarres séries d'invites, il vous donnera automatiquementclause de désambiguïsationC'est un peu comme l'explosion de la capsule de Lao Luo à l'époque, où vous divisez certains mots et les transformez enboîte déroulanteet associe automatiquement plusieurs autres options.

Voici quelques rendus officiels

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Baidu est revenu à la raison et la Wenshin Intelligent Body Platform aura un accès complet à DeepSeek !

Nouvelles de l'IA

Il y a 7 mois

011.5K

Google lance le moteur Vertex AI RAG : un guichet unique pour la création d'applications génératives fiables, optimisées par la recherche.

Nouvelles de l'IA

Il y a 8 mois

013.6K

德勤《行动提示：AI代理如何重塑工作的未来——生成式AI的扩展能力、用例及其对企业的影响》

Alerte à l'action de Deloitte : Comment les agents d'IA remodèlent l'avenir du travail - Évolutivité de l'IA générative, cas d'utilisation et impact sur l'entreprise

Nouvelles de l'IA

Il y a 10 mois

013.8K

Tencent a accès à DeepSeek-R1, dont l'utilisation est gratuite ! L'hybride a dit : n'y a-t-il pas d'amour ?

Nouvelles de l'IA

Il y a 7 mois

014.2K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Google lance la vidéo d'IA Veo2 et la cartographie d'IA Imagen3

I. Vidéo AI Veo 2

II. Dessin AI Imagen 3

SiliconCloud lance le modèle vidéo accéléré Mochi-1-Preview

Smart Spectrum a publié un modèle de vision gratuit GLM-4V-Flash dont la limite de simultanéité a été relevée à 10, cette fois-ci suffisamment pour les environnements de production.

Articles connexes

Baidu est revenu à la raison et la Wenshin Intelligent Body Platform aura un accès complet à DeepSeek !

Google lance le moteur Vertex AI RAG : un guichet unique pour la création d'applications génératives fiables, optimisées par la recherche.

Alerte à l'action de Deloitte : Comment les agents d'IA remodèlent l'avenir du travail - Évolutivité de l'IA générative, cas d'utilisation et impact sur l'entreprise

Tencent a accès à DeepSeek-R1, dont l'utilisation est gratuite ! L'hybride a dit : n'y a-t-il pas d'amour ?

Pas de commentaires

Dernières collections

Derniers articles

Google lance la vidéo d'IA Veo2 et la cartographie d'IA Imagen3

I. Vidéo AI Veo 2

II. Dessin AI Imagen 3

SiliconCloud lance le modèle vidéo accéléré Mochi-1-Preview

Smart Spectrum a publié un modèle de vision gratuit GLM-4V-Flash dont la limite de simultanéité a été relevée à 10, cette fois-ci suffisamment pour les environnements de production.

Articles connexes

Baidu est revenu à la raison et la Wenshin Intelligent Body Platform aura un accès complet à DeepSeek !

Google lance le moteur Vertex AI RAG : un guichet unique pour la création d'applications génératives fiables, optimisées par la recherche.

Alerte à l'action de Deloitte : Comment les agents d'IA remodèlent l'avenir du travail - Évolutivité de l'IA générative, cas d'utilisation et impact sur l'entreprise

Tencent a accès à DeepSeek-R1, dont l'utilisation est gratuite ! L'hybride a dit : n'y a-t-il pas d'amour ?

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles