ハイテク分野の競争は常に激化している。最近、中国のAIスタートアップであるDeepSeekのチームは、大規模な宣伝をすることなく地味にV3のベースモデルをアップデートした。 ディープシーク-V3-0324 は、開発者がダウンロードしてデプロイできるよう、Hugging Faceプラットフォーム上でひっそりと稼働を開始した。このアップデートの知名度は低いものの、コード機能の面で新モデルが大幅に強化されたことで、技術コミュニティではすぐに大きな関心と熱い議論が巻き起こった。
数時間前、DeepSeek-AIは、2025年3月24日にHuggingFaceにアップロードされたDeepSeekV3の更新版、バージョン0324を、MITプロトコルを使用してオープンソース化した。
モデル構成情報によると、DeepSeekV3-0324 は依然として MoE グランドモデルであり、256 個のルーティン グ・エキスパートと、各エキスパートに 1 個の共有エキスパートを含む。 トークン 推論に8人のエキスパートを使用。 DeepSeekV3-0324は、RoPEにより最大コンテキスト長163840(160K)まで拡張可能。 モデルの語彙サイズは129280で、軽量な微調整をサポートするLoRAメカニズムを統合。
これらのパラメータはいずれも、2024年12月26日にリリースされたDeepSeekV3から変更されていないため、今回のアップデートは、元のモデルの継続的なトレーニングまたはポストトレーニングの結果である可能性が高い。
コード能力はクローズソースのベンチマークに急上昇
ユーザからの第一印象と複数のテストによると、DeepSeek-V3-0324 の最も顕著な改善は、コード生成と理解機能です。多くのテス ターが、数学的推論やフロントエンド開発などの分野で、新バージョンは、DeepSeek-V3-0324 よりも優れていると指摘しています。 クロード 3.5とクロード3.7ソネット。ソーシャルメディアXのブロガー@KuittinenPetriは、DeepSeek-V3-0324は、美しいHTML5、CSS、フロントエンドのコードを簡単かつ自由に作成することができる。 アンソロピック とOpenAIは新たな課題を突きつけている。
例えば、DeepSeek-V3-0324はシンプルなコマンドで、NexusAIというAI企業のための見栄えのするレスポンシブなホームページを生成し、すべての要素を1つのHTML5ファイルに統合することができました。 生成されたコードは958行で、必要な画像リソースまで含む、インタラクティブでモバイルフレンドリーなウェブサイトとなった。 KuittinenPetri氏によると、DeepSeek-V3-0324は以下のようなものだという。 ディープシーク 現在入手可能な最高の非推測モデルは、クリエイティブな文章を書くのが得意なだけでなく、HTML5 + CSS + フロントエンド・コードを生成するのもR1よりさらに得意になっている。 また、別のユーザーは、DeepSeek-V3-0324にウェブサイトを作成させることに成功し、モデルが一度に800行以上のコードを生成し、サイトのレイアウトもかなりうまくいきました。
マルチシナリオの実世界テスト、強力なプログラミングの可能性を示す
DeepSeek-V3-0324 のプログラミング能力をより完全に評価するために、多くの研究者がさまざまな シナリオでテストを実施し、旧 V3、Claude 3.7、o1 pro などのモデルと比較しました。 テストの結果、プログラミングの面で新バージョンの V3 が大幅に改善されていることが証明されました。
- テキストをビジュアライゼーション・ページに: テキスト記述をインタラクティブなWebページに変換するテストにおいて、DeepSeek-V3-0324は旧V3バージョンからの飛躍的な進歩を示しました。 新バージョンで生成された Web ページは、コンテンツが豊富なだけでなく、ユーザ・インタフェースのデザ インとレイアウトも大幅に改善されており、Claude 3.5 から 3.7 へのアップグレードを凌駕しています。 DeepSeek-V3-0324は、Claude 3.7の長所と見なされることの多い、PDFファイルのコンテンツをWebページの美しい中国語の視覚化に変換するための詳細な指示に従うことができることは注目に値します。
- 3Dアニメーションを生成する: JSコードベースからインタラクティブな3Dプレゼンテーションを生成するテストでは、新しいV3はチョコレート作りの各ステップをモデル化し、タブ付きインタラクションとサイドバーをサポートすることができた。 Claudeにはまだ改良の余地があるが、旧V3の能力を大幅に上回っている。
- UIコンポーネントのデザイン: 天気予報UIコンポーネントのデザインテストでは、V3-0324はアニメーション性能と天気予報テキストラベルの精度が向上しており、実用的なユーザーインターフェースを生成する能力が高まっていることがわかる。
- 物理世界のシミュレーション: 回転する六角形の中でバウンドするボールをシミュレートしたテストでは、DeepSeek-V3-0324 はボールの衝突効果を正確に実装しています。 まだいくつかの欠点はありますが、全体的なパフォーマンスは古いV3よりも良く、o1 proと同等です。
- AIゲーム・ジェネレーション: 最も印象的なのは、DeepSeek-V3-0324が、たった1文の命令で、効果音とAI支援モードを備えたプレイ可能なピクセルヘビゲームを生成したことである。 クロード3.7の拡張思考モードには複雑さと完成度で及ばないかもしれないが、完全に機能するゲームを完成させることができたという事実は、その強力なプログラミング能力を見事に証明している。
技術的特長とコスト優位性
DeepSeek-V3-0324はまだ詳細なモデルカードを公開していないが、パラメータサイズが6850億であることが知られている。 なお、DeepSeek V3では ハイブリッド・エキスパート・モデリング(MoE) 6,710億のパラメータを持つアーキテクチャで、そのうち1回の推論でアクティブになるのは370億だけである。 (編集部注:MoEモデルは、モデルの性能を維持しながら、大規模なモデルを複数の「エキスパート」サブネットワークに分解することで、計算コストとレイテンシーを大幅に削減する) 従来の MoE モデルにおける専門家の負荷の不均衡という問題を解決するために、ディープシークは V3 で次のような革新的な提案を行っている。 補助ロスのない負荷分散戦略 また、V3は「バイアス項」を用いてエキスパートの負荷を動的に調整し、モデルのパフォーマンスとトレーニング効率を向上させる。 さらに、V3では ノード制約型ルーティングメカニズム 大規模な分散トレーニングにおける通信コストを削減する。
強力なパフォーマンスに加えて、DeepSeek-V3-0324はリラックスしたMITオープンソースプロトコルを継続している。 さらに決定的に重要なのは、そのAPIがOpenAIのものと比べて競争力のある価格であることだ。 o1-pro
少なくとも50倍は安い。 Claude 3.7と比較すると、DeepSeek v3はインプットの価格が約10分の1、アウトプットは標準時間帯で約13分の1、特別時間帯ではさらに27分の1である。 この魅力的な価格優位性は、オープンソースの性質と相まって、AIプログラミングの普及と発展の強力なインセンティブとなることは間違いない。
DeepSeek-V3-0324 モデルの特徴
DeepSeek-V3-0324は、いくつかの重要な分野において、前モデルであるDeepSeek-V3から大幅に改善されています。
- 推理力が向上する:
- MMLUプロ:75.9 → 81.2 (+5.3)
- GPQA: 59.1 → 68.4 (+9.3)
- アイム:39.6 → 59.4 (+19.8)
- LiveCodeBench: 39.2 → 49.2 (+10.0)
- フロントエンドのウェブ開発機能を強化:
- コード実行機能強化
- ウェブやゲームのフロントエンドがより美しくなる
- 中国語の文章力向上:
- スタイルと内容の質が向上した:
- R1に近い文体
- 中長文の質が高い
- 機能強化
- 多ラウンド対話型書き換え機能の向上
- 翻訳と通信の品質を最適化
- スタイルと内容の質が向上した:
- 中国の検索能力強化:
- レポート分析リクエストの詳細出力
- 機能呼び出し機能の改善
- 関数呼び出し 精度の向上、V3バージョンからのレガシー問題の修正
使用上の推奨事項
システムプロンプト
特定の日付を含む同じシステムアラートが、DeepSeekの公式Web/アプリで使用されます。
该助手为DeepSeek Chat,由深度求索公司创造。
今天是{current date}。
例
该助手为DeepSeek Chat,由深度求索公司创造。
今天是3月24日,星期一。
温度パラメーター設定
DeepSeek の Web 環境およびアプリケーション環境では、温度パラメータ (Tモデル多くのユーザが API 呼び出しでデフォルトの温度 1.0 を使用していることを考慮して、DeepSeek は API 温度 (Tアプリ)のマッピング機構により、API入力温度値1.0を最適なモデル温度設定0.3に調整する。
Tモデル = Tアプリ × 0.3 (0 ≤ Tアプリ ≤ 1)
Tモデル = Tアプリ - 0.7 (1 < Tアプリ ≤ 2)
したがって、API経由でV3を呼び出すと、温度1.0はモデル温度0.3に対応する。
ファイルアップロードとウェブ検索のプロンプト
ファイルアップロードの場合は、以下のテンプレートに従ってプロンプトを作成してください。 {file_name}
そして{file_content}
歌で応える {question}
をパラメータとする。
file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""
ウェブ検索用。{search_results}
そして{cur_date}
歌で応える {question}
をパラメータとする。
中国語のクエリ
search_answer_zh_template = \
'''# 以下内容是基于用户发送的消息的搜索结果:
{search_results}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文,请列出所有相关的引用编号,例如[citation:3][citation:5],切记不要将引用集中在最后返回引用编号,而是在答案对应部分列出。
在回答时,请注意以下几点:
- 今天是{cur_date}。
- 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
- 对于列举类的问题(如列举所有航班信息),尽量将答案控制在10个要点以内,并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项;如非必要,不要主动告诉用户搜索结果未提供的内容。
- 对于创作类的问题(如写论文),请务必在正文的段落中引用对应的参考编号,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解读并概括用户的题目要求,选择合适的格式,充分利用搜索结果并抽取重要信息,生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长,对于每一个要点的论述要推测用户的意图,给出尽可能多角度的回答要点,且务必信息量大、论述详尽。
- 如果回答很长,请尽量结构化、分段落总结。如果需要分点作答,尽量控制在5个点以内,并合并相关的内容。
- 对于客观类的问答,如果问题的答案非常简短,可以适当补充一到两句相关信息,以丰富内容。
- 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
- 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
- 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{question}'''
英語の問い合わせプロンプト
search_answer_en_template = \
'''# The following contents are the search results related to the user's message:
{search_results}
In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.
When responding, please keep the following points in mind:
- Today is {cur_date}.
- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.
- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.
- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.
- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.
- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.
- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.
- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.
- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:
{question}'''
ローカル・ランニング・メソッド
DeepSeek-V3-0324 のモデル構造は、DeepSeek-V3 と同じです。 このモデルをローカルで実行する方法の詳細については ディープシーク-V3 コード・リポジトリ。
このモデルは、関数呼び出し、JSON出力、FIM補完などの機能をサポートしている。 これらの機能を使用するためのプロンプトの作成方法については DeepSeek-V2.5 コード・リポジトリ。
DeepSeek-V3-0324は地味なアップデートだが、技術界では大きな注目を集めている。 コーディング能力の面で目覚ましい進歩を遂げ、多くのプログラミングタスクで強さを発揮するだけでなく、クロード3.5/3.7ソネットのようなトップモデルに匹敵する部分もある。 そのオープンソースで効率的かつ費用対効果の高い性質は、将来にとって良い兆しだ。 AIプログラミングの普遍化の時代が加速するかもしれない DeepSeek より多くのサードパーティプラットフォームが新しいV3バージョンのDeepSeekに接続されることで、開発者とユーザーは同様に、より低コストで高度なAIプログラミング機能を体験できるようになります。 これは間違いなく、AIエコシステム全体に新たな活力を注入し、より革新的なアプリケーションの出現を促進するでしょう。 強力なコード能力V3とトップクラスの推論能力R1を備えたDeepSeekの将来のR2モデルは待つ価値がある。
今回のDeepSeekV3のアップデートは、中国のAI技術が急速に発展し、追いついていることを改めて証明するものです。 DeepSeek-V3-0324のオープンソースと無料の商用ライセンス戦略は、間違いなく、より多くの開発者と企業がAIアプリケーション開発の仲間入りをし、共同でAI技術の進歩と普及を促進することになるでしょう。