AIモデルの開発はますます多様化しており、大規模言語モデル、小規模言語モデルに加え、ワールドシミュレータと呼ばれる「ワールドモデル」がAIの次の重要な発展方向のひとつとみなされている。
2024年、AIのパイオニアでありコンピューター科学者でもあるフェイフェイ・リーの空間知能スタートアップ、ワールド・ラボは「大きな世界モデル」の構築を目標に2回の資金調達を完了し、現在の評価額は10億ドルに達している。 ソラ ワールド・シミュレーターの構築責任者の一人であるOpenAIも、ソラを世界の模型と表現している。
AIに現実世界を理解させる
AIの世界モデルは、人間の心モデルから着想を得ている。人間の脳は感覚から情報を取り込み、周囲の世界についてより具体的な理解を深めていく。
AI研究者のデイビッド・ハとユルゲン・シュミットフーバーは論文の中で、時速100マイルの速球を打てる野球のバッターの例を挙げている。筋肉が脳モデルの予測に基づいて、本能的に適切なタイミングと場所でバットを振るのだ。メンタル・モデリングは人間の知性の前提条件であると主張されてきた。
AIシステムとして、AIワールドモデルも同じ道をたどる。AIのスタートアップ・ランウェイによれば、AIワールドモデルは、外部環境に対する内部的な手がかりを構築し、その手がかりに基づいて将来の環境イベントをシミュレートすることができる。ワールドモデルの目標は、現実世界とまったく同じ状況をシミュレートすることである。
なぜ世界のモデルが注目されるのか?
実際、ワールド・モデリングという概念は10年以上前から存在していたが、その歴史はまだ浅い。 このように関心が高まっている理由のひとつは、AIが作成したビデオの台頭である。 .
TechCrunchは、AIが生成した動画コンテンツの多くは、手足がねじれたり、融合したりしているように見えるなど、今日でも「恐怖の谷(Valley of Horror)」現象に悩まされていると指摘している。さらに、生成AIモデルは、バスケットボールのバウンドの方向などの物理現象を正確に予測することはできるかもしれないが、何年もの画像トレーニングにもかかわらず、実際にはバスケットボールがなぜバウンドしているのかはわかっていない。
対照的に、3D世界知覚を持つ世界モデルは、バスケットボールのバウンドの影響をよりよく示すことができる。AIがこのような洞察を得るためには、世界モデルを写真、音声、ビデオ、テキストなどのさまざまなデータでトレーニングする必要がある。
メタ社のチーフAIサイエンティストであるリクン・ヤンのような研究者は、次のように述べている。 世界モデルは将来、デジタルと物理の両方の領域で、複雑な予測やプランニングに使用することができる。 ワールド・ラボの共同設立者であるジャスティン・ジョンソンは、世界モデルは将来こうなる可能性があると語った。 ゲームやバーチャル写真などのためのバーチャル3D世界を生成する。 .
開発者にとっては、世界の強力なモデルがあれば、各オブジェクトがどのように動くかを1つ1つ定義する必要はなく、面倒で時間を浪費する作業となりがちだ。AIは自分自身が置かれたシナリオを自己理解し、可能性のある解決策を推論し始めることができる。
ワールド・モデリングのために越えるべき3つの壁
世界モデルのコンセプトは魅力的だが、技術的な課題はまだ多い。2024での講演で、ヤン・リークンは、彼が思い描く世界モデルの実現には少なくともあと10年はかかるだろうと認めた。
海外メディアの分析によれば、世界モデルが直面している障害は、現在のAIモデルの発展の縮図でもあるという。第一に ワールドモデルのトレーニングと実行には、多くの演算能力が必要だ --世界の初期モデルとされるソラのためだけに、何千ものGPUが必要なのだ。
加えて 世界モデルは幻覚も引き起こす また、学習データにバイアスが内在する可能性もある。例えば、ヨーロッパの都市の晴れた日のビデオに基づいて訓練された視覚モデルは、雪の降る韓国の都市を理解したり表現したりするのが難しいかもしれない。
この問題に対処するためだ。 ワールドモデルのトレーニングデータは、さまざまなシナリオをカバーできるほど広範でなければならないだけでなく、AIがさまざまなシナリオのニュアンスを理解できるほど具体的でなければならない。 しかし、AI開発は現在データ不足の危機にも直面している。しかし、AI開発は現在、データ不足の危機にも直面しており、エポックAIは、開発者は2026年から2032年の間に生成AIモデルを訓練するためのデータを使い果たすだろうと予測している。
マシュラボフ氏によれば、ハードルを乗り越えれば、このワールドモデルはAIと現実世界を「より強力に」結びつけるものになり、仮想世界の生成だけでなく、ロボット工学やAIの意思決定の分野でも大きな進歩をもたらす画期的なものになるという。
関連アイテム