DeepSeek：メディアが無視する問題

45.5K 00

ゲスト寄稿者のLennart HeimとSihao Huang、この記事はChinaTalkの常連寄稿者であり、最近、時限コンピューティング時代の地政学に関する議論に参加したLennartのブログと、以前、グローバルAIガバナンスに関する北京のビジョンについて書いたSihaoのブログからのクロス投稿です。

に関する最近の報道ディープシーク AIモデルに関する報道は、主にベンチマークにおける優れたパフォーマンスや効率性の向上に焦点が当てられてきた。これらの成果は認識できるものであり、政策的な意味合いもある（詳細は下記参照）が、コンピューティング・リソースへのアクセス、輸出規制、AI開発の現実は、多くの報道で紹介されている以上に複雑である。以下、注目すべきポイントをいくつか紹介する：

AIチップの実質的な輸出規制は2023年10月に始まるが、その効果がないという現在の主張は時期尚早だ。 DeepSeekは、当初の2022年10月の制限を回避するために設計されたチップであるNvidia H800で訓練する。DeepSeekの計算タスクでは、これらのチップの性能は米国で入手可能なH100に匹敵する。Nvidiaの最新のH20（中国への輸出が可能なAIチップ）は、学習面では弱いが、展開面では依然として強力である。
トレーニングにおける制限にもかかわらず、H20は最先端のAI、特に長時間の文脈推論のようなメモリ集約的なタスクにおいて、制限のない堅牢性を維持している。これは、特にコンピュート・オン・テスト、合成データ生成、強化学習など、計算能力よりもメモリに多くを依存するプロセスのトレンドにおいて非常に重要です。高帯域幅メモリ（HBM）の輸出規制が2024年12月に施行されるため、H20の継続的な利用可能性は、特にAIコンピュート需要がますますデプロイメント側に傾いている状況において、注目に値する。
ハードウェアの輸出規制にはタイムラグがあり、まだ完全には有効ではない。
これはすべて、輸出規制が完璧に実施されていることを前提としているが、実際はそうではないことに注意されたい。半導体規制には多くの抜け穴があり、大規模なチップ移転があったという信頼できる証拠がある。拡散フレームワークは、こうした抜け穴の一部を塞ぐのに役立つかもしれないが、執行が重要な課題であることに変わりはない。[JS: もちろん、欧米のクラウドへのアクセスの問題はまだあります。]米国企業が数十万個のチップを含むデータセンターを建設しているのに対し、中国は輸出規制前に建設された数万個のチップを含むデータセンターをいまだに使用している。これらのデータセンターをアップグレードしたり拡張したりする必要が生じたときに、本当の試練が訪れるだろう。このプロセスは、米国企業にとっては容易だが、輸出規制の対象となる中国企業にとっては難しい。次世代モデルのトレーニングに10万個のチップが必要となれば、輸出規制は中国での最先端モデル開発に大きな影響を与えるだろう。しかし、そのような大規模な訓練要件がなくても、輸出規制は、展開能力を低下させ、企業開発を制限し、訓練データと自己ゲームを合成する能力を阻害することによって、中国のAIエコシステムに重大な影響を与えるだろう。

ディープシークV3がより少ない計算資源で学習を完了するのは当然のことで、機械学習アルゴリズムのコストは時間の経過とともに低下している。 しかし、ディープシークのような中小企業がAI機能を利用できるようになるのと同じ効率化（つまり、"アクセシビリティ効果"）、また、他の企業がより大規模なコンピューティングクラスター上でより強力なシステムを構築することを可能にするかもしれない（すなわち、"パフォーマンス効果").ありがたいことに、DeepSeekは20万個のB200（Nvidiaの最新世代チップ）の代わりに2,000個のH800だけを使用してV3を訓練した。

リリースのタイミングには戦略的な考慮があるが、技術力は本物だ。 R1のリリースは、先週のトランプ大統領の就任式と重なり、アメリカの政策にとって重要な時期に、アメリカのAIリーダーシップに対する国民の信頼を損なわせるために行われたことは明らかだ。これはファーウェイがライモンド前商務長官の訪中時に新製品を発表したのと同じ戦略だ。結局、R1プレビューのベンチマーク結果は11月に公開された。
この慎重なPRのタイミングは、ディープシークの技術的進歩と、輸出規制による現在および将来の構造的課題という2つの事実を曖昧にしてはならない。
輸出規制は単一の訓練タスクに正確に影響を与えることは難しいが、AIエコシステム全体の発展を効果的に抑制することができる。特に、最先端のチップに対する制限は、大規模なAIの展開（すなわち、多数のユーザーがAIサービスにアクセスできるようにすること）や能力の強化を効果的に制約する可能性がある。 AI企業は通常、60～80%のコンピュート・リソースをデプロイメントに割り当てている。コンピュート・リソースを制限することは、中国製AIのコストを増加させ、大規模展開の能力を低下させ、システム性能を制限することになる。また、デプロイメント・コンピューティングは、ユーザーアクセスだけでなく、合成トレーニングデータの生成、モデル間の相互作用による能力向上の促進、モデルの構築、拡張、最適化においても重要な役割を果たしていることは注目に値する。
例えば、グワーン氏の最近のコメントでは、デプロイメント・コンピューティングがAI開発において、ユーザーアクセスをはるかに超える重要な役割を果たしていることが指摘されている。OpenAIのo1のようなモデルは、高品質のトレーニングデータを生成するために使用することができ、デプロイメント能力が開発能力と全体的なパフォーマンスの向上を直接促進するフィードバックループを作成します。
DeepSeekの効率向上は、以前受けた大規模な演算サポートに起因しているのかもしれない。 ディープシークは、アジア初の1万チップのA100クラスターを運用し、5万チップのH800クラスターを維持し、中国内外のクラウド・サービス・プロバイダー（輸出規制対象）に無制限にアクセスできると報じられている。また、中国内外のクラウド・サービス・プロバイダー（輸出規制対象外）にも無制限にアクセスできる。このようなコンピューティング・パワーへの広範なアクセスは、反復テストによる効率的な技術開発と、顧客へのモデリング・サービスの提供に不可欠である。
ディープシークが同様のスパイクに対応できるかどうかはまだ検証されておらず、限られたコンピューティング・パワーで挑戦することになる。(サム・アルトマンは次のように主張している。チャットGPT プロ契約プランは現在赤字である)。
彼らのR1モデルは優れた効率性を示したが、その開発プロセスは、合成データの生成、蒸留、実験のための多くの演算に依存していた。
輸出規制は米中の算術格差をさらに悪化させており、ディープシークにとっては依然として大きな制約となっている。ディープシークの首脳陣は、効率性を改善してもなお、4倍の算術的不利に直面していることを公に認めている。ディープシークの創設者であるウェンフェン・リャンは、「これは、同じ結果を得るためには2倍のコンピューティング・パワーが必要であることを意味します。データ効率にも約2倍の開きがあります。つまり、同等の結果を得るためには、2倍のトレーニングデータとコンピューティングパワーが必要なのです。つまり、同等の結果を得るためには、2倍のトレーニングデータと計算能力が必要なのです」。短期的には資金調達の計画はありません。私たちの問題は資金調達ではなく、ハイエンドチップの禁輸なのです」。
米国の主要なAI企業は、その最強の能力を秘匿しているため、公的なベンチマークはAI開発の全体像を正確に反映していない。 中国企業は進捗状況を公に共有する傾向がある。アンソロピック DeepSeekが注目されている理由のひとつは、そのオープンさである。ディープシークが注目されているのは、そのオープン性によるところが大きい。モデルの重み付けや方法論を詳細に共有しており、欧米企業の閉鎖的な傾向が強まっているのとは対照的だ。しかし、オープンであることが必ずしも戦略的優位性につながるかどうかはまだわからない。

つまり、どういうことなんだ？

ディープシークの功績は本物であり、重要である。彼らの進歩を単なるプロパガンダとして片付けるのは不正確だ。ディープシークが報告しているトレーニングコストは前例がないものではなく、アルゴリズム効率の過去の傾向もこれを裏付けています。DeepSeekは最終的なトレーニング前の実行コストのみを報告しており、スタッフ人件費、先行実験、データ取得、インフラ開発などの重要な経費は無視されています。異なるコスト計算方法から生じる誤解を招きやすい比較の詳細については、こちらの記事をご覧ください。

演算効率が高まるということは、AIの能力が最終的に普及することを意味する。 社会のレジリエンスと防衛力を強化し、AIリスクを特定、評価、対応できる制度を構築し、敵対国からの潜在的なAIの脅威に対して強固な防衛システムを構築するためには、補完的な措置が必要である。しかし、輸出規制はすでに中国のAI開発に影響を及ぼしており、将来的にはさらに強い影響を及ぼす可能性があることも認識すべきである。

モデルそのものは、多くの人が「戦略的堀」と考えるようなものではないかもしれないが、演算能力が国家安全保障に与える影響は、アプリケーションのシナリオによって異なる。大規模な展開が必要なアプリケーション（例えば、大規模な監視）では、容量の制約が大きな障壁となる可能性がある。一方、シングルユーザーアプリケーションでは、規制の影響はそれほど大きくはない。算術的利用可能性と国家安全保障能力との関係は、モデル化された能力自体は再現しやすくなっているものの、依然として複雑である。

統制にもかかわらずAI能力が拡散する可能性があり、拡散を完全に阻止することは常に困難であるが、こうした統制は技術的優位性を維持するために不可欠であることに変わりはない。統制は貴重な時間を稼ぐが、民主主義国家が常に時代の先端を行き、潜在的なライバルからの挑戦をかわすことができるようにするためには、補完的な政策が依然として必要である。