AI Personal Learning
und praktische Anleitung

Was ist ein KI-"Weltmodell"? Warum investieren Fei-Fei Li, Google und OpenAI in dieses Modell?

Die Entwicklung von KI-Modellen wird immer vielfältiger: Neben großen Sprachmodellen und kleinen Sprachmodellen werden "Weltmodelle", sogenannte Weltsimulatoren, als eine der nächsten wichtigen Entwicklungsrichtungen der KI angesehen.

Im Jahr 2024 hat das Startup World Labs des KI-Pioniers und Informatikers Feifei Li zwei Finanzierungsrunden mit dem Ziel abgeschlossen, ein "großes Weltmodell" zu erstellen, und wird derzeit mit 1 Milliarde Dollar bewertet, während Google DeepMind das Bilderzeugungsmodell von OpenAI abgeworben hat Sora Einer der Verantwortlichen für die Entwicklung des World Simulator; OpenAI beschreibt Sora auch als ein Modell der Welt.


 

World Labs: Erstellen Sie ein 3D-Modell der Welt aus einem einzigen Bild, bewerben Sie sich für die "Spatial Intelligence"-Modellqualifikation-1

Was genau ist ein Weltmodell? Warum bekommt es mehr Aufmerksamkeit?

 

Der KI ein Verständnis für die reale Welt vermitteln

Das KI-Weltmodell orientiert sich am menschlichen Verstandesmodell - das menschliche Gehirn nimmt Informationen von den Sinnen auf, um ein konkreteres Verständnis der Welt um sich herum zu entwickeln.

In einem Aufsatz führen die KI-Forscher David Ha und Jürgen Schmidhuber das Beispiel von Baseballspielern an, die 100 mph schnelle Bälle schlagen können, weil sie "instinktiv" die Richtung des Balls vorhersagen können, was durchdacht ist und unbewusst geschieht - ihre Muskeln schwingen den Schläger instinktiv zur richtigen Zeit und am richtigen Ort, basierend auf den Vorhersagen des Gehirnmodells. Es wurde argumentiert, dass mentale Modellierung eine Voraussetzung für menschliche Intelligenz ist.

Als KI-System verfolgt ein KI-Weltmodell denselben Weg. Dem KI-Startup Runway zufolge kann ein KI-Weltmodell interne Anhaltspunkte für die äußere Umgebung konstruieren und künftige Umweltereignisse auf der Grundlage dieser Anhaltspunkte simulieren; das Ziel des Weltmodells ist es, eine Situation zu simulieren, die der realen Welt genau entspricht.

 

Warum stehen die Weltmodelle im Rampenlicht?

Tatsächlich gibt es das Konzept der Weltmodellierung schon seit mehr als einem Jahrzehnt, aber die Einer der Gründe für dieses wachsende Interesse ist die Zunahme von KI-generierten Videos .

TechCrunch stellt fest, dass die meisten KI-generierten Videoinhalte heute immer noch unter dem Valley of Horror-Phänomen leiden, z. B. indem sie Gliedmaßen als verdreht oder miteinander verschmolzen darstellen. Außerdem sind generative KI-Modelle zwar in der Lage, physikalische Phänomene wie die Absprungrichtung eines Basketballs genau vorherzusagen, aber trotz jahrelangem Bildtraining wissen sie nicht, warum der Basketball abspringt.

Im Gegensatz dazu kann ein Weltmodell mit 3D-Wahrnehmung die Auswirkungen eines Basketballsprungs besser darstellen. Damit KI diese Erkenntnisse gewinnen kann, muss das Weltmodell mit einer Reihe von Daten trainiert werden, darunter Fotos, Audio, Video und Text.

Das Potenzial des Weltmodells ist nicht auf die Erstellung von Videos beschränkt. Forscher wie Likun Yang, der leitende KI-Wissenschaftler von Meta, sagten, dass Weltmodelle können in Zukunft für komplexe Vorhersagen und Planungen sowohl im digitalen als auch im physischen Bereich eingesetzt werden Justin Johnson, Mitbegründer von World Labs, erklärte seinerseits, dass Weltmodelle in Zukunft Erstellen Sie virtuelle 3D-Welten für Spiele, virtuelle Fotografie usw. .

Mit einem leistungsfähigen Modell der Welt müssen die Entwickler nicht mehr definieren, wie sich jedes Objekt einzeln bewegt - eine oft mühsame, umständliche und zeitraubende Aufgabe.Alex Mashrabov, ehemaliger Leiter der KI bei Snap und CEO von Higgsfield, erklärte gegenüber der Presse, dass die KI mit einem fortschrittlichen Modell der Welt in der Lage ist, ein eigenes Verständnis für jedes Szenario zu entwickeln und über mögliche Lösungen nachzudenken. KI in der Lage ist, ein Selbstverständnis für jedes Szenario zu entwickeln, in dem sie sich befindet, und damit zu beginnen, über mögliche Lösungen nachzudenken.

 

3 zu überwindende Mauern für die Weltmodellierung

Das Konzept eines Weltmodells ist zwar verlockend, doch gibt es noch viele technische Herausforderungen. In einem Vortrag auf der Konferenz 2024 räumte Li-Kun Yang ein, dass es noch mindestens 10 Jahre dauern wird, bis das von ihm angestrebte Weltmodell realisiert werden kann.

Nach der Analyse ausländischer Medien sind die Hindernisse, mit denen das Weltmodell konfrontiert ist, auch ein Mikrokosmos für die aktuelle Entwicklung von KI-Modellen. Erstens. Das Trainieren und Ausführen von Weltmodellen erfordert eine Menge Rechenleistung -Tausende von Grafikprozessoren werden allein für Sora benötigt, das als ein frühes Modell der Welt gilt.

Darüber hinaus. Das Weltmodell erzeugt auch Halluzinationen und kann Verzerrungen in den Trainingsdaten verinnerlichen. So kann ein visuelles Modell, das auf der Grundlage eines Videos eines sonnigen Tages in einer europäischen Stadt trainiert wurde, Schwierigkeiten haben, eine verschneite koreanische Stadt zu verstehen oder darzustellen, oder sogar völlig falsche Inhalte erzeugen.

Um dieses Problem zu lösen. Die Trainingsdaten für das Weltmodell müssen breit genug sein, um nicht nur verschiedene Szenarien abzudecken, sondern auch spezifisch genug, damit die KI die Nuancen der verschiedenen Szenarien verstehen kann. Allerdings steht die KI-Entwicklung derzeit auch vor einer Datenknappheitskrise. Allerdings steht die KI-Entwicklung derzeit auch vor einer Krise der Datenknappheit. Epoch AI prognostiziert, dass den Entwicklern zwischen 2026 und 2032 die Daten zum Trainieren generativer KI-Modelle ausgehen werden.

Wenn die Hürden überwunden werden, könnte das Weltmodell eine "viel stärkere" Verbindung zwischen KI und der realen Welt darstellen - ein Durchbruch nicht nur bei der Erzeugung virtueller Welten, sondern auch ein großer Fortschritt in den Bereichen Robotik und KI-Entscheidungsfindung.

 

Ähnliche Artikel

World Labs: Erstellen Sie ein 3D-Modell der Welt aus einem einzigen Bild, bewerben Sie sich für den Betatest des Spatial Intelligence-Modells!

Skybox AI: Generierung von 360°-Panoramabildern zur einfachen Erstellung virtueller Welten

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Was ist ein KI-"Weltmodell"? Warum investieren Fei-Fei Li, Google und OpenAI in dieses Modell?

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)