NVIDIA, コンピュータグラフィックスカード会社 (NVDA)、アルファベットの グーグル (GOOGL)と注目の新興企業OpenAIは、ディープラーニングの人工知能アルゴリズムを訓練するための膨大なデータ要件を満たすために、「合成データ」工場に目を向けている。今週開催されたコンシューマー・エレクトロニクス・ショーで、チップメーカーのCEOは、エヌビディア株にとって好材料となる可能性のあるデータ合成能力をアピールした。
合成データへの移行は、AI企業が強力なAIモデルを訓練するのに必要な実世界のデータを使い果たしているという報告の中で行われた。
「合成データは、希少データや機密データのニーズに対応するための重要なソリューションです。大手AI企業がトレーニングに使用可能なインターネットデータを枯渇させる中、この傾向は加速している」と、データサイエンティストのベン・ロリカは2025年展望レポートの中で述べている。
「大規模な組織では、合成データを独自のデータセットと組み合わせることができるかもしれません。「この技術を実務家がより利用しやすくするために、主要なAIラボから改良された合成データ生成ツールが登場することを期待したい。
2025年のCESで、エヌビディアのCEOであるJen-Hsun Huang氏は、自動車やロボット工学のアプリケーションにおけるAIの将来の役割をアピールした。合成データが助けになる、と彼は言った。
エヌビディア株:"データ工場"
「エヌビディアは従来のデータを収集・整理し、それを使って合成データを作成している」と、CESでの進捗報告でエコノミストのエド・ヤルデニは述べた。「従来のデータと合成データの両方が、エヌビディアのデータ工場でAIエージェントやボットを訓練するために使われる。
さらにヤルデニは、「(チップメーカーは)Nvidiaに大きな違いをもたらした。 コスモス 自然、人間、物理的世界に関連するあらゆるものに関する2,000万時間のビデオを見て、Nvidia Cosmosは開発されました。これらの現実世界のシナリオに基づいて、さらに多くのシナリオを作成するための合成データを作成することもできます。そして、その実データと合成データを使って、倉庫での作業や自動運転車の運転など、世界をナビゲートする必要のあるロボットを訓練することができる。"
グーグルのクラウド・コンピューティング部門もまた、企業向けアプリケーションのための合成データを大々的に推進している。さらに、推論機能を強化したOpenAIの最新のベースモデルは、合成データ生成技術を使用している。
2025年に向けての大きな議論は、人工的に作成された高品質の学習データへのアクセスが困難になったため、AIモデルが頭打ちになり始めたかどうかということだ。さらに、グーグルや メタプラットフォーム (META)METAのようなテック大手は、YouTube、マップ、インスタグラム、フェイスブックから、より大きなモデルを構築するために使用できる独自の内部データを持っている。
一方、エヌビディアの株価は2025年に41 TP3T上昇。2023年に2,391 TP3T上昇した後、エヌビディアの株価は2024年に1,711 TP3T上昇する。