ディープシーク-R1 モデルはその優れた推論能力で注目されている。 ユーザーを助けるために公式DeepSeekプラットフォーム体験と同じパフォーマンスを得る公式の詳細なデプロイメント・ガイドが発表された。 この記事では、このガイドを深く読み解く。検索やファイルアップロードシナリオのプロンプトとして提供される公式テンプレートや、思考ステップをスキップするモデルを軽減するさまざまなコマンドの解明に焦点を当てる。. これらの公式コンフィギュレーションをマスターし、それに厳密に従うことが、公式DeepSeek-R1の素晴らしさを再現する鍵です!本稿では、DeepSeek-R1 をローカルに展開しようとしている開発者と、モデル性能の深堀りを行おう としている研究者の両方に、重要な参考資料を提供します。 DeepSeek-R1をローカルに展開しようとしている開発者であれ、モデル性能を深く掘り下げようとしている研究者であれ、本稿は以下のような場合に役立つ重要なリファレンスを提供します。DeepSeek-R1の体験は、公式規格の正確なレプリカである。.
DeepSeek-R1のリリースは、AI技術コミュニティで多くの注目を集めており、多くの開発者がこの強力な推論モデルを積極的に展開し、適用しようとしています。DeepSeekチームは、ユーザーが優れた経験を得られるように、公式の導入ガイドをリリースしました。この記事では、読者がDeepSeek-R1のベストプラクティスを完全に理解し、モデルのパフォーマンス最適化の主要なテクニックをマスターすることを目的として、ガイドを深く読み、コアポイントを抽出し、モデルの機能を詳細に分析します。
1.DeepSeek-R1モデルのテクニカル分析
ディープシーク は、DeepSeek-R1-ZeroとDeepSeek-R1からなる第一世代の推論モデルを発表した。DeepSeek-R1-Zeroは、大規模な強化学習(RL)のみに依存する技術革新であり、学習前のステップとして教師あり微調整(SFT)を必要とする従来のパラダイムを逆転させた。このアプローチにより、DeepSeek-R1-Zeroは優れた推論能力を獲得し、推論タスクにおいて優れた能力を発揮し、多くの魅力的な推論特性を自然に引き出すことができます。
しかし、DeepSeek-R1-Zero は、出力の繰り返し、可読性の低さ、一部のケー スでの言語の混在など、完璧ではありません。これらの限界を克服し、モデルの推論性能をさらに向上させるために、DeepSeekチームはDeepSeek-R1を導入しました。 DeepSeek-R1のDeepSeek-R1-Zeroに対する主な改善点は、強化学習の前に「コールドスタートデータ」を組み込むことです。 これにより、数学、コーディング、複雑な推論タスクにおけるモデルのパフォーマンスが効果的に向上し、以下のようなOpenAIのモデルに匹敵するようになりました。 OpenAI-o1
.
研究コミュニティに還元するため、DeepSeekは、DeepSeek-R1-Zero、DeepSeek-R1、およびDeepSeek-R1から抽出したLlamaとQwenアーキテクチャに基づく6つの高密度モデルを惜しみなくオープンソース化しています。特筆すべきは、DeepSeek-R1-Distill-Qwen-32Bが、いくつかのベンチマークで、DeepSeek-R1-Distill-Qwen-32Bを上回っていることです。 OpenAI-o1-mini
小型高密度モデルの新たなパフォーマンスベンチマークとなる。
特別なヒント DeepSeek-R1 ファミリをローカルに展開して実行する前に、「2.コア構成のポイント」をよく読んで、DeepSeek-R1 ファミリを最適に使用することを強くお勧めします。 公式プラットフォームの一貫した体験を可能な限り再現する。.
2.核となる構成要素:公式に一貫した結果を再現する
DeepSeek の公式チームは、DeepSeek-R1 の導入と使用に関して、公式モデルのパラメータ設定のベストプラクティスに基 づいた以下のコア推奨事項を提供しています。 ユーザがローカル環境で公式デモプラットフォームと一致する優れたパフォーマンスを再現するには、こ れらの設定を厳密に順守することが重要です。 特に、公式検索&ファイルアップロードプロンプトテンプレートのみならず緩和モデルは思考をバイパスするガイドラインはさらに重要であり、ローカルに展開されたDeepSeek-R1が公式基準を満たすことができるかどうかを直接決定する:
2.1 システムプロンプトが表示されない:
DeepSeek-R1 モデルは、システム・プロンプトなしで動作するように設計されています。 公式プラットフォームとの整合性を保ち、望ましいモデルの動作を得るには、システム・プロンプトを無効にして、すべての指示をユーザ・プロンプトに直接含めることが重要です。 明確で簡潔な質問は、公式プラットフォームのプロンプトの取り扱いと一致し、モデルがユーザーの意図を正確に理解するのに役立ちます。
2.1 温度パラメーターを0.6に設定する(温度:0.6):
Temperatureパラメータは、モデル出力のランダム性と創造性に直接影響します。 公式には、このパラメータを0.6に設定することを推奨しています。このパラメータは、ローカルに配置されたモデルの出力スタイルが公式プラットフォームの出力スタイルと一致することを保証するための重要なパラメータの1つであり、出力の創造性と一貫性の理想的なバランスをとります。 値を低く設定すると、より保守的で決定論的なモデル出力になり、値を高く設定すると、モデルがより多様で斬新な回答をするようになりますが、公式の温度設定から逸脱すると、ローカルモデルと公式プラットフォームとの間で回答スタイルに違いが生じる可能性があります。
2.3 モデルバイパス思考を緩和するためのガイドライン
複雑なクエリを処理する際に、DeepSeek-R1 モデルが十分に理性的な思考を行えるようにするため、各入力プロンプトの最初に明示的な思考指導の指示を追加することを強くお勧めします。 <think>\n
. これはモデルが思考ステップをスキップするのを緩和する効果的な手段であるだけでなく、ローカルに展開されたモデルが公式プラットフォームと同じ深さの推論を再現できるようにするための中核的な設定でもある。 この指令を無視したり誤用したりすると、複雑な推論タスクにおいてローカルモデルが公式プラットフォームから逸脱する可能性がある。 このディレクティブはモデルを効果的に「思考モード」に導き、十分な推論を行わずに結果を出力することを防ぎます。 <think>\n\n</think>
).
2.4. 数学問題の最適化
数学の問題では、ローカルに配置された環境で公式プラットフォームと整合性のある正確な解答を得るために、ヒントの中で「ステップバイステップで推論する」ことを明示的に求め、「ステップバイステップで推論し、最終的な解答を☑に入れてください」など、最終的な解答の形式をヒントの中で指定することを推奨します。". 明確な指示と書式の要件は、モデルが問題の種類をよりよく理解し、適切な解決策を採用するのに役立ち、ローカルモデルの数学問題への解答能力が公式プラットフォームと一致することを保証します。
2.5 パフォーマンス評価
ローカルに展開された DeepSeek-R1 と公式プラットフォームとの性能差を客観的に比較するために は、複数のテストを実施し、複数のテスト結果の平均を計算することで、より信頼性の高い性能評価データを得 ることを推奨します。 単一のテスト結果は偶然に左右される可能性がありますが、複数のテスト結果を平均化すること で、モデルの真のレベルをより正確に反映し、ローカル展開が公式の性能をうまく再現できたかどうかを ユーザが評価するための科学的根拠を提供することができます。
2.6 検索とファイルアップロードのための公式プロンプト
公式の DeepSeek の展開では、オープンソース版と同じ DeepSeek-R1 モデルが使用されます。 ローカルに配置された DeepSeek-R1 モデルが公式 DeepSeek-R1 モデルと同じユーザ エクスペリエンスを得られるようにし、特定のシナリオで DeepSeek-R1 モデルのパフォーマンスを最大化するために、DeepSeek-R1 モデルには、ファイルのアップロードと Web での検索の 2 つの最も一般的なシナリオ用に特別に設計および調整されたキューテンプレートが用意されています。 これらの公式プロンプトテンプレートを完全に採用して正しく使用することが、ローカルに配置された DeepSeek-R1 が公式プラットフォームのパフォーマンスを再現するための最も重要な保証です。 キューテンプレートに変更や調整を加えると、特定のタスクでローカルモデルが公式プラットフォームのパフォーマンスから逸脱する可能性があります。
1.ファイルアップロードシナリオプロンプトテンプレート
ファイルをアップロードし、そのファイルの内容に基づいてモデルに質問に答えさせたい場合、ユーザーは以下の公式テンプレートを使用して厳密にプロンプトを作成する必要があります。 特に{file_name}
そして{file_content}
歌で応える {question}
これら3つのプレースホルダーは、ユーザーによってアップロードされたファイル名、ファイルの内容、ユーザーによって質問された内容を表しています:
file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""
2.ウェブ検索シナリオのヒントテンプレート(ウェブ検索)。
ユーザーがウェブ検索の結果で答える必要のある質問をした場合、必ず以下の公式ウェブ検索ヒントテンプレートを使用してください。 テンプレートには {search_results}
(検索結果)、{cur_date}
(現在の日付)と {question}
(ユーザーの問題)3つの重要なパラメーター。
DeepSeekは、中国語と英語のクエリに最適化されたテンプレートを提供します:
- 中国語の検索テンプレート(search_answer_zh_template):
search_answer_zh_template = \
'''# 以下内容是基于用户发送的消息的搜索结果:
{search_results}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文,请列出所有相关的引用编号,例如[citation:3][citation:5],切记不要将引用集中在最后返回引用编号,而是在答案对应部分列出。
在回答时,请注意以下几点:
- 今天是{cur_date}。
- 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
- 对于列举类的问题(如列举所有航班信息),尽量将答案控制在10个要点以内,并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项;如非必要,不要主动告诉用户搜索结果未提供的内容。
- 对于创作类的问题(如写论文),请务必在正文的段落中引用对应的参考编号,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解读并概括用户的题目要求,选择合适的格式,充分利用搜索结果并抽取重要信息,生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长,对于每一个要点的论述要推测用户的意图,给出尽可能多角度的回答要点,且务必信息量大、论述详尽。
- 如果回答很长,请尽量结构化、分段落总结。如果需要分点作答,尽量控制在5个点以内,并合并相关的内容。
- 对于客观类的问答,如果问题的答案非常简短,可以适当补充一到两句相关信息,以丰富内容。
- 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
- 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
- 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{question}'''
- 英語のクエリテンプレート (search_answer_ja_template):
search_answer_en_template = \
'''# The following contents are the search results related to the user's message:
{search_results}
In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.
When responding, please keep the following points in mind:
- Today is {cur_date}.
- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.
- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.
- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.
- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.
- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.
- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.
- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.
- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:
{question}'''
公式の一貫性を守るための追加ガイドライン:
公式に提供されたプロンプトのテンプレートに厳密に従うことに加え <think>\n
説明に加えて、以下の追加ガイドラインを参照することで、ユーザはローカルの展開環境で公式プラットフォームのパ フォーマンスを最大限に高め、ローカルの DeepSeek-R1 ランタイムを「最高の状態」にすることができます:
- 数学の問題:前のセクションと同じように、数学の問題では、プロンプトの中で「段階的推論」を行うようモデルに明示的に求め、「段階的に推論し、最終的な答えを☑に入れてください」など、公式の書式を使って最終的な答えをマークすることが再び重要です。\boxed{}」と記入してください。 ローカルモデルが数学的計算能力において公式プラットフォームと完全に一致するように、数学的問題の取り扱いに関する公式の詳細には必ず従ってください。
- 性能評価: ローカルに配置された DeepSeek-R1 が公式プラットフォームの性能を正常に再現しているかど うかを正確に評価するには、複数のテストを実施し、その結果の平均を計算することをお勧めします。 複数のテスト結果を平均化することで、1 回のテストに関連する偶然性と誤差が低減され、ローカル配備の成否を判断し、微調整を行うための、より科学的で信頼性の高い根拠が得られます。 パフォーマンス評価の厳密さは、ローカル配備計画の有効性に直結する。
概要
DeepSeek が提供するすべての構成ガイドラインに厳密に従います。特に、公式ティップ・ テンプレートと <think>\n
ソートリーダーシップの指示は、ユーザがローカル環境で公式 DeepSeek-R1 プラットフォームの優れたパフォーマンスを再現するための基本的な保証であり、「オリジナル」の DeepSeek-R1 体験を得るための唯一の方法です。 DeepSeek-R1のモデルアーキテクチャ、トレーニング方法、および仕組みを理解し、公式の推奨事項をローカル展開のあらゆる側面に実装することで、ローカルモデルと公式プラットフォームのパフォーマンスの一貫性を最大限に高めることができます。 これらのガイドラインを実践して、ローカル環境で公式の DeepSeek-R1 体験を再現してください!