AI Personal Learning
und praktische Anleitung
Ressource Empfehlung 1

Videogenerierungsmodell VBench führt die Charts an... An der Spitze der Charts - WanX 2.1 wird bald Open Source sein!

Open Source am Horizont: KI-Videoerstellung für die breite Masse

Aufregende Neuigkeiten! AliCloud hat offiziell angekündigt, dass sein mit Spannung erwartetes KI-Videogenerierungsmodell der nächsten Generation, WanX 2.1, bald als Open Source verfügbar sein wird! 🎉 Dieses Modell, das als "Neudefinition der Videogenerierung" gepriesen wurde, hat seit seiner Veröffentlichung viel Aufmerksamkeit in der Branche erregt. Nun hat AliCloud beschlossen, WanX 2.1 als Open Source zu veröffentlichen, was der KI-Videoproduktion zweifelsohne neue Impulse verleihen wird.

Video Generation Models Top VBench Charts - WanX 2.1 wird bald Open-Sourced! -WanX 2.1 wird bald als Open-Source verfügbar sein!


WanX 2.1 ist die neueste Ergänzung der multimodalen Makromodelle "Wanx" von AliCloud. Während "Tongyi Wanxiang" im Juli 2023 debütierte, stellt WanX 2.1 den neuesten technologischen Fortschritt in der Modellreihe dar. Es erzeugt nicht nur hochwertige Bilder und Videos auf der Grundlage von Textbefehlen, sondern ist auch das weltweit erste Modell, das chinesische und englische Texteffekte unterstützt.

 

Überragende Leistung: Spitzenreiter in den Vbench-Charts

WanX 2.1 ist erstaunlich gut darin, fotorealistische Videos zu erzeugen. Egal, ob es um komplexe Bewegungsszenen, die Optimierung der Pixelqualität oder das genaue Erfassen der physikalischen Regeln geht, WanX 2.1 zeigt eine hervorragende Leistung. Insbesondere seine Genauigkeit beim Verstehen und Ausführen von Benutzerbefehlen lässt es in der renommierten Liste der VBench Video Generation Models mit einer Gesamtpunktzahl von 84,7% hervorstechen, wobei es in Schlüsselmetriken wie Dynamik, räumliche Beziehungen und Interaktionen zwischen mehreren Objekten führend ist.

Zum Zeitpunkt der Erstellung dieses Dokuments ist MiracleVision V5 an der Spitze.

Video Generation Models Top VBench Charts - WanX 2.1 wird bald Open-Sourced! -WanX 2.1 wird bald als Open-Source verfügbar sein!

Was macht WanX 2.1 so herausragend? Es kann nicht von der kontinuierlichen Innovation und den technologischen Durchbrüchen des AliCloud-Forschungsteams getrennt werden.

 

Technologische Innovation: Schaffung einer realistischeren Videowelt

Auf der Suche nach der ultimativen Qualität der visuellen Erzeugung hat das WanX 2.1-Forschungsteam eine Reihe von Schlüsseltechnologien erforscht und erneuert:

  • Selbstentwickelte VAE- und DiT-RahmenwerkeWanX 2.1 verwendet die Aliyun-eigenen Verfahren VAE (Variable Auto-Encoder) und DiT (Denoising Diffusion). Transformator), wodurch die Fähigkeit des Modells, das Timing und die räumlichen Beziehungen von Videos zu verstehen, erheblich verbessert wird. Dadurch ist WanX 2.1 in der Lage, realistischere und natürlicher wirkende Videoinhalte zu erzeugen, wenn es um Szenen mit komplexen Bewegungs- und Physikregeln geht.
  • Omni-temporale AufmerksamkeitsmechanismenWanX 2.1 ist durch die Einführung des Mechanismus der Ganztagsaufmerksamkeit in der Lage, die komplexe und wechselnde Dynamik in der realen Welt genauer zu erfassen und zu simulieren, wodurch die erzeugten Videos lebendiger und anschaulicher werden.
  • Extra langes KontexttrainingUm die Fähigkeit des Modells, Textbefehle zu verstehen und auszuführen, zu verbessern, verwendet WanX 2.1 auch eine ultralange Kontext-Trainingsmethode, die den Modell-Trainingsprozess beschleunigt und eine nahtlose Verbindung zwischen Textbefehlen und der Erstellung von Videoinhalten herstellt, wodurch die Videoerstellung schneller und intuitiver wird.
  • Erste zweisprachige Texteffekte in Englisch und ChinesischWanX 2.1 ist das erste Videogenerierungsmodell in der Branche, das zweisprachige Texteffekte unterstützt. Dadurch werden die Anwendungsszenarien erheblich erweitert und die vielfältigen kreativen Anforderungen der Werbedesign- und Kurzfilmproduktionsbranche besser erfüllt.

 

Video Generation Models Top VBench Charts - WanX 2.1 wird bald Open-Sourced! -WanX 2.1 wird bald als Open-Source verfügbar sein!

 

Texttipp: "Panoramaaufnahme einer Eiskunstläuferin auf einer Eisbahn. Sie trägt ein lilafarbenes Eislaufkostüm und weiße Schlittschuhe und führt eine Drehbewegung aus. Ihre Arme sind weit ausgebreitet und ihr Körper ist nach hinten geneigt, was ihre Geschicklichkeit und Anmut zeigt".

Dank dieser Innovationen ist WanX 2.1 in der Lage, große Körperbewegungen und komplexe Rotationsszenen mit Leichtigkeit zu bewältigen. Selbst in anspruchsvollen Szenarien wie Eiskunstlauf, Schwimmen und Tauchen, die ein hohes Maß an Flugbahn- und Körperkoordination erfordern, kann WanX 2.1 glänzen und setzt einen neuen Qualitätsmaßstab für die Videoerstellung.

 

Open Source Sharing: Ermöglichung einer breiteren kreativen Ökologie

Derzeit ist WanX 2.1 auf der offiziellen Website von China verfügbar. ein vollständiges Bild von allem Kostenlose Erfahrung ist verfügbar. Einzelne Entwickler und Unternehmensanwender können als Erste die Leistungsfähigkeit von WanX 2.1 über die Aliyun Model Studio-Plattform erleben, ihre Kreativität entfesseln und effizient hochwertige Videoinhalte erstellen.

Die bevorstehende Open Source bedeutet, dass WanX 2.1 nicht mehr auf eine bestimmte Plattform beschränkt sein wird, sondern in das breitere Ökosystem der KI-Technologie integriert wird. Aliyuns Schritt wird zweifellos die Popularität und Entwicklung der KI-Videoproduktionstechnologie stark fördern, so dass mehr Entwickler und Kreative auf den Schultern von Giganten stehen und gemeinsam die unendlichen Möglichkeiten der KI-Videoproduktion erforschen und die tiefe Verschmelzung von KI-Technologie und der Kreativbranche wirklich realisieren können. Freuen wir uns auf den Tag, an dem WanX 2.1 als Open Source veröffentlicht wird und erleben wir die Ankunft einer neuen Ära der KI-Videoerstellung!

Inhalt 1
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Videogenerierungsmodell VBench führt die Charts an... An der Spitze der Charts - WanX 2.1 wird bald Open Source sein!

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)