AI Personal Learning
und praktische Anleitung
Ressource Empfehlung 1

PixVerse V4 wird neu aufgelegt: Videorealismus, Sound und Geschwindigkeit wurden durchweg verbessert

Zu Beginn des Jahres 2025 befindet sich der KI-Videobereich in einem neuen technologischen Wettlauf, schneller als erwartet. Kurz nach der Veröffentlichung von OmniHuman-1 folgte PixVerse mit einem neuen Modell-Update und kündigte offiziell die Ankunft von PixVerse V4 an. Als Beobachter auf dem Gebiet der KI-Technologie hatte ich die Ehre, vor fünf Tagen die PixVerse V4 zu erleben. Nach umfangreichen Tests hat die V4-Version sichtbare Fortschritte bei der Texterzeugung, der Bilderzeugung und neuen Funktionen gezeigt, und die zugrunde liegende Modellfähigkeit hat einen qualitativen Sprung gemacht.

Deutlich verbesserte Text-zu-Film-Videogenerierung

Die verbesserten Fähigkeiten von PixVerse V4 bei der Generierung von Text zu Video sind beeindruckend. Nachfolgend finden Sie einige vom Autor getestete Fälle, um den Generierungseffekt des neuen Modells zu veranschaulichen:

Textgenerierung Video Fall 1: Tornado-Katastrophenfilm

Cue in. Tornados, Hochgeschwindigkeitsbewegungen, Spannung und Aufregung, ein orangefarbener Sportwagen aus den 80ern auf einer Stadtstraße, der sich mit hoher Geschwindigkeit bewegt und driftet. Katastrophenfilm-Atmosphäre.

Texterstellung Video Fall 2: Nebliger Hirsch

Cue in. Ein ätherischer Hirsch mit einem Körper aus silbrigem Nebel, der im Mondlicht schwach schimmert. Sein Geweih ist mit schwebenden Lichtkugeln geschmückt, und er bewegt sich lautlos, wobei er eine schimmernde Nebelspur hinter sich lässt.


Textgenerierungsvideo Fall 3: Raum-Zeit-Warpsprung

Cue in. Raum-Zeit-Verzerrungs-Sprungsequenz: Die Einstein-Feldgleichungen werden angewandt, um die Raum-Zeit-Verzerrung zu simulieren, und die Kamera bewegt sich entlang der Kerr-Ansichtsfläche des Schwarzen Lochs, um den visuellen Effekt der Zeitdilatation zu aktivieren. Am Sprungpunkt wird eine Raumzeitsingularität gesetzt, und der Penrose-Solver-Algorithmus wird eingeführt, um die Lichtkegelverzerrung zu berechnen (Verzerrungsfaktor 145%).

Die Unterstützung von PixVerse V4 für Sci-Fi- und Hardcore-Physikeffekte ist besonders gut, mit verblüffenden Generierungsergebnissen. Um die Verbesserungen von PixVerse V4 bei Sci-Fi und Hardcore-Physikeffekten besser zu veranschaulichen, schauen wir uns eine Fallstudie an. Hier ist das Stichwort, um dieses Video zu generieren:

Cue in. Hypersphärische Dimensionssprunglinse: 11-dimensionale räumliche Projektion der Linsenbewegung unter Verwendung eines Riemannschen Trajektorienalgorithmus zur Aktivierung eines visuellen Frühwarnsystems für topologische Defekte während des Dimensionskollapses.

Im Falle des hypersphärischen Dimensionssprungs erscheint der Text im Video, aber Tests zeigen, dass die Steuerbarkeit der Texterzeugung in der aktuellen Version zu wünschen übrig lässt; Text kann in textgenerierten Videos erzeugt werden, aber die Texterzeugung wird in bildgenerierten Videos noch nicht unterstützt, und nur die englische Eingabe wird unterstützt.

Die Generationsgeschwindigkeiten haben sich drastisch erhöht und die V4-Modelle sind fest in der T1-Echelon.

Neben der deutlichen Verbesserung der Generierungsergebnisse ist eine weitere beeindruckende Eigenschaft von PixVerse V4 die drastische Steigerung der Generierungsgeschwindigkeit. Im Extremmodus können Videos in etwa 5 Sekunden generiert werden, was eine deutliche Verbesserung der Effizienz darstellt. Alles in allem ist PixVerse V4 eine deutliche Verbesserung gegenüber V3.5, und das neue V4-Modell ist zweifellos die erste Stufe der aktuellen KI-Videobranche.

Wenn man auf die Geschichte von PixVerse zurückblickt, ist das Tempo der Technologie-Iterationen bemerkenswert: v1 ging am 15. Januar 2024 online, v2 am 24. Juli, v2.5 am 22. August, v3 am 29. Oktober, v3.5 am 29. Dezember, und die neueste v4 wurde am 24. Februar veröffentlicht. Die Strategie von PixVerse, an einer schnellen, iterativen Modellierungsfähigkeit festzuhalten, ist die richtige. Obwohl PixVerse mit seiner Funktion für Effektvorlagen in den sozialen Medien viel Aufsehen erregt hat und in einigen Ländern des Nahen Ostens sogar die Charts im App Store angeführt hat, hat PixVerse seine Modell-Iteration nicht verlangsamt, sondern seine Modellentwicklung eher beschleunigt.

Seit DeepSeek große Aufmerksamkeit erregt hat, herrscht im Bereich der KI allgemeiner Konsens darüber, dass "die einzige Anwendung der KI die Intelligenz selbst ist". Die Modellfähigkeit ist der Eckpfeiler der KI-Technologieentwicklung. Die Funktionalität auf Anwendungsebene und die Optimierung der Erfahrungen zielen alle darauf ab, die Schwelle für die Nutzung der KI-Technologie für die Nutzer zu senken, genau wie der Koeffizient der Modellfähigkeit. Wenn die Modellfähigkeit beispielsweise 10 Punkte beträgt, ist die interessante Funktion der Spezialeffektvorlage wie ein Koeffizient von 10, und die endgültige Anwendungsleistung kann 100 Punkte erreichen. Wenn die Modellfähigkeit hingegen nur 1 Punkt beträgt, ist die endgültige Wirkung nicht zufriedenstellend, auch wenn die Anwendung leistungsfähiger ist.

Auf der anderen Seite verdient Runway, ein Unternehmen im Bereich der KI-Videos, Anerkennung für seine innovativen Funktionen wie Act-One und Super Lens Motion. In den letzten sechs Monaten scheint es jedoch keine nennenswerten iterativen Aktualisierungen der Runway-Modelle gegeben zu haben. Brancheninsider wissen sehr wohl, was sechs Monate im Zusammenhang mit der sich schnell verändernden KI-Technologie bedeuten. PixVerse hat ein Gleichgewicht zwischen technologischer Iteration und Funktionsinnovation gefunden: Während das Modell schnell iterativ bleibt, werden die zugrundeliegenden Fähigkeiten des Modells weiter verbessert, wodurch andere Funktionsinnovationen wertvoller werden.

Soundfunktionen und Effektvorlagen wurden verbessert

PixVerse V4 führt eine überzeugende neue Funktion ein: den Ton.

Aufmerksamen Lesern ist vielleicht aufgefallen, dass die meisten der im vorherigen Abschnitt gezeigten Beispiele im Videoformat und nicht als GIFs vorliegen. Das liegt daran, dass die von PixVerse V4 generierten Videos bereits über natürliche und flüssige Toneffekte verfügen. (Die textgenerierten Videobeispiele im vorherigen Abschnitt sind nicht im Videoformat, da die Plattform die Anzahl der Videos in einem einzelnen Beitrag begrenzt). Der Benutzer muss nur die Funktion Sound aktivieren, um die Soundeffekte automatisch an die generierten Videos anzupassen.

Darüber hinaus hat PixVerse V4 neue Funktionen wie Speech (Lippensynchronisation) und Restyle (Stilmigration) hinzugefügt, die Sie selbst ausprobieren können. Wie bereits erwähnt, ist ein starkes Basismodell eine Voraussetzung für das effektive Funktionieren der einzelnen Funktionen.

Zu guter Letzt wollen wir uns auf die wichtigste Funktion von PixVerse konzentrieren - die FX-Vorlagen. Als Pionier der FX-Vorlagen hat PixVerse die Qualität der FX-Vorlagen mit den Modellierungsmöglichkeiten der V4-Version auf die nächste Stufe gehoben.

PixVerse wurde für seine Effektvorlagen hoch gelobt, und mit der Version V4 des Modells wurde die Textur und Bewegung des resultierenden Videos noch einmal verbessert.

Kurz gesagt, eine starke Modellfähigkeit ist der Grundstein für die Entwicklung der KI-Videotechnologie. Nur durch die kontinuierliche Verbesserung der Intelligenz des Modells selbst können die Anwendungsfunktionen wie Spezialeffekte, Soundeffekte, Stilmigration usw. ihr Potenzial voll ausschöpfen und den Nutzern ein neues Erlebnis bieten. Es ist absehbar, dass der Wettbewerb im Bereich der KI-Videos noch intensiver werden wird, und technologische Innovation ist zweifellos der Schlüssel für Anbieter wie PixVerse, um ihre führende Position zu halten.

Inhalt 2
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " PixVerse V4 wird neu aufgelegt: Videorealismus, Sound und Geschwindigkeit wurden durchweg verbessert

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)