一言で言えば、デスクトップに置けるパーソナルAIスーパーコンピューターである。
NVIDIAは本日、CES 2025において、以下の製品を発表しました。 NVIDIAプロジェクトDIGITSこれは、デスクトップに置くことができるパーソナルAIスーパーコンピューターである。
- 従来は大規模なデータセンターを必要としていたAIコンピューティングを、すべての人のデスクトップに導入する。
- 小規模な実験から大規模な生産まで、開発プロセス全体をサポートする費用対効果の高いコンピューティング・ソリューションを提供。
これは何をするものなのか?
Project DIGITSは、一般ユーザーが自分のコンピューターでできる優れたAIコンピューティングツールを提供する:
Project DIGITSは、1PFLOP(1.5ギガフロップ)のデータ処理が可能な新しいNVIDIA GB10 Grace Blackwell Superchipを搭載しています。1秒間に1000兆回の浮動小数点演算。)AIの計算性能。
大規模なAIモデルのプロトタイピング、微調整、実行用に設計されており、ユーザーはローカルのデスクトップ・システム上で推論モデルを開発・実行し、クラウドやデータセンターにシームレスに展開することができる。
つまり、地元で超大型AIモデルを動かすことができるのだ。2,000億パラメータまで実行可能な大規模言語モデル(例えば...).
また、ローカルコンピューター上でAIモデルを開発・テストし、それをクラウドやデータセンターに迅速に展開するためのサポートもある。一言で言えば開発者全員にポケットサイズのAIスーパーコンピューターを持たせるようなものだ!
そのコア技術は何か?
プロジェクトDIGITSの心臓部はGB10スーパーチップと呼ばれるチップである:
SoC設計:NVIDIA Grace Blackwellアーキテクチャに基づき、NVIDIA Blackwell GPU(最新世代のCUDAコアと第5世代のTensorコアを搭載)と、ディープラーニングに最適化された高性能NVIDIA Grace CPUを統合している。
効率的なパフォーマンス:FP4の精度で入手可能 1PFLOP(毎秒1,000兆浮動小数点演算)の演算性能は、Arm® アーキテクチャの新世代です。また、低消費電力と高性能を実現するArmアーキテクチャに基づく20個の高性能コアを搭載しています。
エネルギー消費と貯蔵:
- 電源は通常のコンセントのみで、特別な設備は不要
- 128GBのユニファイドメモリと4TBのNVMeストレージ
パフォーマンスは素晴らしい:非常に複雑なAIタスクを実行することができる。 2000億パラメータ大規模な言語モデルの
スケーラビリティ:NVIDIA ConnectXネットワークを通じて。プロジェクトDIGITSのスーパーコンピューター2台を接続し、4,050億のパラメトリックモデルを実行。.
接続パフォーマンスNVLink-C2CによるGPUとCPUの高速相互接続。
何のために、誰のために?
何が言いたいんだ?
ローカル開発とテスト:開発者は、ローカル環境でAIモデルのプロトタイプを迅速に作成し、実験することができます。
クラウド拡張:ローカルで開発したモデルを直接クラウドに移行し、展開を加速できる。
効率的なパフォーマンスとコストの比較:大規模データセンターに匹敵するコンピューティングパワーを、わずかなコストとエネルギー消費で提供します。
多様なアプリケーションシナリオ:ディープラーニング、自然言語処理、コンピュータビジョンなど、さまざまな分野のAIアプリケーションをサポート。
誰のため?
- AI研究者、データサイエンティスト、学生、新興企業に最適。
- 使い始めが簡単:普通のコンピューターの設定だけで使える。
- 柔軟性:ローカル開発からクラウド展開までシームレス。
代表的なアプリケーション・シナリオ
AI研究とイノベーション
大規模言語モデル(LLM)や生成AIアプリケーションなどの複雑なAIモデルを開発し、テストする。
プロトタイプの開発、モデルの微調整、実験を行う。
データサイエンス
RAPIDSやその他のツールを使って、大規模なデータセットを迅速に処理・分析する。
データクリーニング、フィーチャーエンジニアリング、モデリングを加速。
教育と学習
大学や学生向けの手頃な価格のAIコンピューティングリソースで、AIの教育や学習の実践をサポートします。
ソフトウェアとエコロジーのサポート
NVIDIAは、ユーザーがAIモデルの開発と導入を迅速に開始できる豊富なソフトウェアエコシステムを提供しています:
(1) 開発ツール
NVIDIA NGC: 開発キット(SDK)、フレームワーク、および訓練済みモデルの包括的なソフトウェアライブラリを提供。
NVIDIA NeMo:大規模言語モデル(LLM)を微調整するためのフレームワーク。
NVIDIA RAPIDS:データサイエンスのワークフローを加速します。
一般的なフレームワークとの互換性:PyTorch、Python、Jupyter Notebookなどの一般的なツールをサポート。
(2) 配備サポート
ユーザーは、ローカルでモデルを開発し、後でコードを変更することなく、NVIDIA DGX Cloudやその他のアクセラレーションされたクラウドおよびデータセンター・アーキテクチャに直接デプロイすることができます。
(3) 企業レベルのサポート
エンタープライズグレードのセキュリティ、サポート、本番環境のリリースに対応したNVIDIA AI Enterpriseソフトウェアを提供。
なぜそれが重要なのか?
かつては大企業や研究所にしか手の届かなかったAIコンピューティング・パワーが、今や一般的な開発者にとって手の届くツールになりつつある。これは何を意味するのか:
小規模なチームや個人は、独自のAIモデルを開発し、テストすることができる。
AIの研究とイノベーションに対する障壁は大幅に軽減される。
すべての人にAIコンピューティングを: ハードウェアのコストと導入の難易度を下げることで、AIテクノロジーの導入を促進します。イノベーションの推進: 個人や小規模チームにかつてないコンピューティング・パワーを提供し、さらなるイノベーションを促します。エコシステムの統合: NVIDIAのハードウェアとソフトウェアのエコシステムをシームレスに統合し、ユーザーにワンストップ・ソリューションを提供します。
価格は?いつ入手できますか?
発売日2025年5月
販売価格:3000ドルから。新しいNVIDIAゲーミングプラットフォームは、NVIDIAおよびトップクラスのパートナーから入手可能です。
NVIDIAのウェブサイトから通知にサインアップしてください。
一方
NVIDIAは、この度、フルモデルチェンジを発表しました。新しいGeForce RTX 50シリーズグラフィックカードとノートパソコン
これらの製品はBlackwell RTXアーキテクチャに基づいており、画期的な性能向上とAI主導のニューラル・レンダリング技術を実現している。
RTX 50シリーズは、最大8倍の性能向上(DLSS 4経由)、最大75%のレイテンシ低減(Reflex 2経由)を実現し、ゲーマーやコンテンツ制作者にまったく新しい可能性を提供します。
パワフルなブラックウェル・アーキテクチャー
920億個のトランジスタを搭載し、最新のGDDR7メモリ(最大30Gbps)を使用して、最大1.8TB/秒のメモリ帯域幅を実現する。
新世代のテンソルコアとレイトレーシング(RT)コアにより、リアルタイムレンダリングとより効率的なAIモデル処理をサポート。
DLSS 4とReflex 2をサポートし、ゲームのスムーズさと応答性を向上。
GeForce RTX 5090
仕様パラメーター:
CUDAコア数:21,760
メモリー:32GB GDDR7
メモリ帯域幅:1792 GB/sテンソル
コア:680(第5世代)
RTコア:170(第4世代)
パフォーマンスの大幅な向上:
RTX 4090の2倍の性能。
DLSS 4とマルチフレームジェネレーションにより、4K解像度、240 FPS、フルライト追従ゲームをサポート。最大2倍高速な画像生成とメモリフットプリントの削減により、ジェネレーティブAIアプリケーションをサポート(FP4モード)。
価格:スタート価格 $1,999
上場日:2025年1月30日
GeForce RTX 5080
仕様パラメーター:
CUDAコア数:16,384
メモリー:16GB GDDR7
メモリ帯域幅:960GB/秒
パフォーマンスの大幅な向上:
RTX 4080の2倍の性能。
オプティカルトラッキングに対応したゲーム(サイバーパンク2077やアランウェイク2など)を4Kでプレイしたり、ブラックマイス:悟空のようなタイトルをプレイすることで、3Dレンダリングやビデオ編集に対するクリエイターの高い要求に応えることができる。
価格:スタート価格 $999
上場日:2025年1月30日
GeForce RTX 5070Ti
仕様パラメーター:
CUDAコア数:12,288
メモリー:16GB GDDR7
メモリ帯域幅:896GB/秒(RTX 4070 Tiを超える78%)
パフォーマンスの大幅な向上:
RTX 4070 Tiの2倍の性能。
解像度2560x1440の高フレームレートでLight Chaseゲームを実行。
価格:スタート価格 $749
発売日:2025年2月
GeForce RTX 5070
仕様パラメーター:
CUDAコア数:10,240
メモリー:12GB GDDR7
メモリ帯域幅:672GB/秒(RTX 4070より大幅に向上)
パフォーマンスの大幅な向上:
RTX 4070の2倍の性能。
DLSS Multi Frame Generationに対応し、解像度2560x1440の高フレームレートでライトトレーシングゲームを実行。
価格:スタート価格 $549
発売日:2025年2月
次世代の革新技術
DLSS 4 ニューラル・レンダリング技術
DLSS 4は、GeForce RTX Tensorコアを搭載したNVIDIAの最新のニューラルレンダリング技術で、鮮明な画質を維持しながらフレームレートを大幅に向上させます。
従来のレンダリングフレーム1枚につき最大3枚の追加フレームを生成
最大8倍のフレームレート向上
4K 240FPSのフルレイトレーシングゲーミングに対応
トランスフォーマーのAIモデルをゲームに初適用
タイミングの安定性とモーションの詳細が向上
リフレックス2 フレームモーフィング・テクノロジー
NVIDIA Reflex 2は、よりスムーズなゲーム体験のための新しいフレームモーフィング技術により、ゲームレイテンシーを最大75%短縮します。
ゲームの待ち時間を75%短縮
CPUとGPUワークフローの同期
最新のマウス入力に基づいてレンダリングフレームを更新
マルチプレイヤーゲームに競争力をもたらす
シングルプレイヤーゲームのレスポンスを高める
NVIDIA ACE AIの役割
NVIDIA ACEは、ジェネレーティブAIを通じてゲームキャラクターやデジタルアシスタントに生命を吹き込むデジタルキャラクター技術群です。
ゲームにおけるAI主導のキャラクター行動
敵AIの継続的学習
自働NPCシステム
数々の有名ゲームをサポート
選手の行動にリアルタイムで対応
プロジェクトR2X PCデジタルマン
Project R2XはビジョンベースのPCアバターで、ユーザーの日常業務を支援し、AIによるアシストを提供する。
R2Xは、ユーザーのデスクトップアシスタントとして機能する視覚ベースのアバターを提供する。
文書の閲覧や要約、アプリケーションの管理、ビデオ会議など、さまざまな作業でユーザーをサポートすることができる。
ビデオ会議のサポート
サポート文書の読解と要約
GPT4、Grok、その他のクラウドベースのAIとの接続
複数の開発フレームワークをサポート
リアルタイムのデスクトップ・アプリケーション支援
ロボット軍団
エヌビディアはまた、自動運転車やロボットなどの物理的AIシステムの開発を加速するために設計された先進的なツール群であるNVIDIA Cosmos™プラットフォームも発表した。
コスモス 生成的なワールド・ファウンデーション・モデル(WFM)、高度なビデオ・トークナイザー、セキュリティ保証メカニズム、高速化されたビデオ処理パイプラインを含む。
このプラットフォームは、リアルな物理ベースの合成データを生成することで、開発者が物理AIモデルの開発コストを劇的に削減できるようにすることを目的としている。
短い答えだ:Cosmosは、ロボット工学や自律走行システムの開発を支援するために特別に設計されている。Cosmosは、AIモデルから仮想データとシミュレーションシナリオを生成し、開発者が実際のデータを収集するために多くの時間と費用を費やすことなく、AIシステムをより迅速かつ安価にトレーニングおよびテストすることを可能にする。
- テキストから世界へ、ビデオから世界へと生成することが可能だ。
- ナノ(低レイテンシーのエッジ展開)、スーパー(高性能ベースラインモデル)、ウルトラ(高忠実度モデル)の3つのモデルがある。
- Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 トークン 2,000万時間に及ぶ実データと合成データを対象としたトレーニング。
- トーケナイザーは、圧縮効率で8倍、処理速度で12倍向上している。
コスモスの主要機能
1.仮想データの生成
- 積雪時の運転状況
- 倉庫におけるロボットの複雑な操作
- 例えば、超リアルな仮想シナリオを作成することができる。このデータはAIシステムの訓練に使用することができ、現実世界のデータへの依存を減らすことができる。
2.ビデオデータの高速処理
- Cosmosのツールは、大規模なビデオデータを従来の10倍以上の速さで照合し、タグ付けすることができるため、時間とコストを節約できる。
3.シミュレーションとテスト
- さまざまな天候や道路状況(雨、霧、渋滞)をシミュレート。
- 工場や倉庫内を移動するロボットの能力をテストする。
- 例えば、ロボットや自律走行システムをバーチャル環境でテストすることが可能だ:
4.AIモデルの開発に協力する
- 開発者がロボット工学や自律走行技術のニーズに合わせてカスタマイズできるオープンソースの基本モデルを提供。
5.複数のアプリケーション・シナリオ
- 自動運転のトレーニング:例えばUberやWaabiは、仮想運転テストシナリオの作成に使用している。
- ロボット開発:AgilityとXPENGは、ロボット操作の訓練と最適化にこれを使用している。
ロボティクス企業の展示
グローバル
- アプトロニックアポロ・ロボティクス
- アジリティ・ロボティクスデジット・ロボティクス
- ニューラ・ロボティクス4NE-1ロボット
- 図図02 ロボット
- 1XNEOロボット
- メンティーMenteeBotロボット
- サンクチュアリAIフェニックス・ロボティクス
中国
- ユニツリー・ロボティクスH1ロボット
- ワイズジェンロボティクス探検隊A2ロボティクス
- スタートレック(米TVシリーズ)スター1ロボット
- ギャラクシー・ジェネラルG1ロボット
- フーリエ・インテリジェンス(Fourier Intelligence)GR-2ロボット
- 小鵬汽車(中国自動車メーカー)アイアンロボット
概要
このエヌビディアのリリースは、AIの応用を促進し、モデルのトレーニングと微調整をコンシューマーグレードの分野に参入させ、AIアプリケーション、スマートハードウェア、ロボティクスを爆発的に普及させる!