DeepSeek-R1 Modelle sind bekannt für ihre hervorragenden Argumentationsfähigkeiten. Um den Benutzern zu helfenSie erhalten die gleiche Leistung wie die offizielle DeepSeek-Plattformwurde ein offizieller detaillierter Leitfaden für die Bereitstellung veröffentlicht. In diesem Artikel werden wir diesen Leitfaden eingehend lesen.Konzentriert sich auf die Analyse der offiziellen Vorlagen, die für Eingabeaufforderungen für Such- und Datei-Upload-Szenarien bereitgestellt werden, sowie auf die verschiedenen Befehle, die das Überspringen des Denkschritts durch Modelle abmildern. Die Beherrschung und strikte Einhaltung dieser offiziellen Konfigurationen ist der Schlüssel zur Reproduktion der offiziellen DeepSeek-R1-Exzellenz!Dieser Artikel bietet eine wichtige Referenz sowohl für Entwickler, die DeepSeek-R1 lokal einsetzen wollen, als auch für Forscher, die sich mit der Modellleistung beschäftigen. Unabhängig davon, ob Sie ein Entwickler sind, der DeepSeek-R1 lokal einsetzen möchte, oder ein Forscher, der die Leistung des Modells genauer untersuchen möchte, bietet dieser Artikel eine wichtige Referenz, die Ihnen hilftDas DeepSeek-R1-Erlebnis ist eine genaue Nachbildung des offiziellen Standards..
Die Veröffentlichung von DeepSeek-R1 hat in der KI-Technologie-Community viel Aufmerksamkeit erregt, und viele Entwickler versuchen aktiv, dieses leistungsstarke Inferenzmodell einzusetzen und anzuwenden. Um den Anwendern zu helfen, eine hervorragende Erfahrung zu machen, hat das DeepSeek-Team einen offiziellen Leitfaden für den Einsatz veröffentlicht. In diesem Artikel werden wir den Leitfaden eingehend lesen, die Kernpunkte extrahieren und die Modellfunktionen im Detail analysieren, um den Lesern zu helfen, die Best Practices von DeepSeek-R1 vollständig zu verstehen und die Schlüsseltechniken der Modellleistungsoptimierung zu beherrschen.
1. technische Analyse des DeepSeek-R1-Modells
DeepSeek hat seine erste Generation von Inferenzmodellen, bestehend aus DeepSeek-R1-Zero und DeepSeek-R1, vorgestellt. DeepSeek-R1-Zero ist eine technologische Innovation, die sich beim Training ausschließlich auf das groß angelegte Reinforcement Learning (RL) stützt und damit das traditionelle Paradigma umkehrt, wonach vor dem Training eine überwachte Feinabstimmung (SFT) erforderlich ist. Dieser Ansatz verleiht DeepSeek-R1-Zero überlegene Argumentationsfähigkeiten, die es ihm ermöglichen, sich bei Argumentationsaufgaben auszuzeichnen und auf natürliche Weise eine Reihe überzeugender Argumentationseigenschaften zu entwickeln.
DeepSeek-R1-Zero ist jedoch nicht perfekt, z. B. leidet es unter sich wiederholenden Ausgaben, schlechter Lesbarkeit und Sprachmischung in einigen Fällen. Um diese Einschränkungen zu überwinden und die Inferenzleistung des Modells weiter zu verbessern, führte das DeepSeek-Team DeepSeek-R1 ein. Die wichtigste Verbesserung von DeepSeek-R1 gegenüber DeepSeek-R1-Zero ist die Einbeziehung von "Kaltstartdaten" vor dem Reinforcement Learning. Dies verbessert die Leistung des Modells bei mathematischen, kodierenden und komplexen Denkaufgaben und macht es vergleichbar mit OpenAI-Modellen wie OpenAI-o1
.
Um der Forschungsgemeinschaft etwas zurückzugeben, hat DeepSeek großzügig DeepSeek-R1-Zero, DeepSeek-R1 und sechs dichte Modelle basierend auf den Llama- und Qwen-Architekturen, die aus DeepSeek-R1 destilliert wurden, als Open Source zur Verfügung gestellt. Vor allem DeepSeek-R1-Distill-Qwen-32B übertrifft in mehreren Benchmarks die OpenAI-o1-mini
und setzt damit einen neuen Leistungsmaßstab für kleine, dichte Modelle.
Besonderer Tipp: Vor dem Einsatz und dem lokalen Betrieb der DeepSeek-R1-Modellfamilie wird den Benutzern dringend empfohlen, die "2. zentralen Konfigurationspunkte" sorgfältig zu lesen, um eine optimale Nutzung der und die konsistente Erfahrung der offiziellen Plattform so weit wie möglich zu reproduzieren.
2. zentrale Konfigurationselemente: Reproduktion offiziell konsistenter Ergebnisse
Das offizielle DeepSeek-Team hat die folgenden Kernempfehlungen für den Einsatz und die Verwendung von DeepSeek-R1 bereitgestellt, die auf Best Practices für die Konfiguration der offiziellen Modellparameter basieren. Die strikte Einhaltung dieser Konfigurationen ist der Schlüssel für Benutzer, um in ihren lokalen Umgebungen eine hervorragende Leistung zu reproduzieren, die mit der offiziellen Demo-Plattform übereinstimmt. Unter anderem ist die offizielleSuche & Datei Upload Prompt Vorlagewie auchMinderungsmodelle umgehen das DenkenDie Richtlinien sind sogar noch kritischer und bestimmen direkt, ob ein lokal eingesetzter DeepSeek-R1 die offiziellen Standards erfüllen kann:
2.1 Keine Systemaufforderung:
Das DeepSeek-R1-Modell ist so konzipiert, dass es ohne System-Eingabeaufforderungen funktioniert. Um mit der offiziellen Plattform übereinzustimmen und das gewünschte Modellverhalten zu erreichen, ist es wichtig, Systemaufforderungen zu deaktivieren und alle Anweisungen direkt in die Benutzeraufforderung aufzunehmen. Eine klare und prägnante Frage hilft dem Modell, die Absicht des Benutzers genau zu verstehen, was mit der Handhabung von Eingabeaufforderungen durch die offizielle Plattform übereinstimmt.
2.1 Setzen Sie den Parameter Temperatur auf 0,6 (Temperatur: 0,6):
Der Parameter Temperatur wirkt sich direkt auf die Zufälligkeit und Kreativität der Modellausgabe aus. Die offizielle Empfehlung lautet, diesen Parameter auf 0,6 zu setzen. Er ist einer der Schlüsselparameter, um sicherzustellen, dass der Ausgabestil lokal eingesetzter Modelle mit dem der offiziellen Plattform übereinstimmt und ein ideales Gleichgewicht zwischen Kreativität und Konsistenz in der Ausgabe besteht. Niedrigere Werte führen zu einer konservativeren und deterministischeren Modellausgabe, während höhere Werte das Modell dazu ermutigen, vielfältigere und neuartigere Antworten zu geben, aber Abweichungen von der offiziellen Temperatureinstellung können zu Unterschieden im Antwortstil zwischen dem lokalen Modell und der offiziellen Plattform führen.
2.3 Leitlinien zur Entschärfung des Modell-Bypass-Denkens:
Um sicherzustellen, dass das DeepSeek-R1-Modell bei der Bearbeitung komplexer Abfragen ausreichend nachdenkt, wird dringend empfohlen, dass die Benutzer am Anfang jeder Eingabeaufforderung ausdrückliche Anweisungen zur Gedankenführung hinzufügen <think>\n
. Dies ist nicht nur ein wirksames Mittel, um das Überspringen von Denkschritten durch Modelle zu verhindern, sondern auch eine Kernkonfiguration, die sicherstellt, dass lokal eingesetzte Modelle die gleiche Argumentationstiefe wie die offizielle Plattform wiedergeben können. Das Ignorieren oder der Missbrauch dieser Direktive kann dazu führen, dass lokale Modelle bei komplexen Argumentationsaufgaben von der offiziellen Plattform abweichen. Diese Direktive leitet das Modell effektiv in den "Denkmodus" und verhindert, dass das Modell Ergebnisse ohne ausreichende Überlegungen ausgibt, d. h. es vermeidet das "Überspringen des Denkschritts" (z. B. die direkte Ausgabe der <think>\n\n</think>
).
2.4 Optimierung für mathematische Probleme
Um bei Mathematikfragen in einer lokal eingesetzten Umgebung genaue Antworten zu erhalten, die mit der offiziellen Plattform übereinstimmen, wird empfohlen, das Modell in den Hinweisen ausdrücklich aufzufordern, "Schritt für Schritt zu argumentieren", und das Format der endgültigen Antwort in den Hinweisen anzugeben, z. B. "Bitte argumentieren Sie Schritt für Schritt und setzen Sie die endgültige Antwort in \boxed{} ". Klare Anweisungen und Formatierungsvorgaben helfen den Modellen, die Problemtypen besser zu verstehen und geeignete Lösungsstrategien anzuwenden, wodurch sichergestellt wird, dass die Fähigkeit des lokalen Modells, Mathematikaufgaben zu lösen, mit der offiziellen Plattform übereinstimmt.
2.5 Leistungsbewertung
Um den Leistungsunterschied zwischen dem lokal eingesetzten DeepSeek-R1 und der offiziellen Plattform objektiv vergleichen zu können, wird empfohlen, mehrere Tests durchzuführen und den Durchschnitt aus mehreren Testergebnissen zu berechnen, um zuverlässigere Daten zur Leistungsbewertung zu erhalten. Während die Ergebnisse eines einzelnen Tests dem Zufall unterworfen sein können, kann der Durchschnitt der Ergebnisse mehrerer Tests das tatsächliche Niveau des Modells genauer widerspiegeln und den Nutzern eine wissenschaftliche Grundlage für die Beurteilung bieten, ob die lokale Bereitstellung die offizielle Leistung erfolgreich reproduziert hat.
2.6 Offizielle Eingabeaufforderungen für Suche und Datei-Upload
Der offizielle DeepSeek-Einsatz verwendet das gleiche DeepSeek-R1-Modell wie die Open-Source-Version. Um sicherzustellen, dass das lokal eingesetzte DeepSeek-R1-Modell die gleiche Benutzererfahrung bietet wie das offizielle DeepSeek-R1-Modell und um die Leistung des DeepSeek-R1-Modells in bestimmten Szenarien zu maximieren, wurde das DeepSeek-R1-Modell mit speziell entworfenen und abgestimmten Cueing-Vorlagen für die beiden häufigsten Szenarien des Hochladens von Dateien und der Suche im Internet versehen. Die vollständige Übernahme und korrekte Verwendung dieser offiziellen Prompt-Templates ist die wichtigste Garantie dafür, dass der lokal eingesetzte DeepSeek-R1 die Leistung der offiziellen Plattform reproduzieren kann. Jegliche Änderungen oder Anpassungen an den Cue-Templates können dazu führen, dass das lokale Modell bei bestimmten Aufgaben von der Leistung der offiziellen Plattform abweicht.
1. die Vorlage für das Szenario zum Hochladen von Dateien.
Wenn Sie eine Datei hochladen und möchten, dass das Modell Fragen zum Inhalt der Datei beantwortet, müssen Sie die Eingabeaufforderungen streng nach der folgenden offiziellen Vorlage erstellen. Unter anderem muss die{file_name}
und{file_content}
im Gesang antworten {question}
Diese drei Platzhalter stehen für den Namen der vom Benutzer hochgeladenen Datei, den Inhalt der Datei und die vom Benutzer gestellte Frage:
file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""
2. die Vorlage für Tipps für die Websuche (Websuche).
Wenn ein Benutzer eine Frage stellt, die mit den Ergebnissen einer Websuche beantwortet werden muss, sollten Sie die folgende offizielle Vorlage für Websuchtipps verwenden. Die Vorlage enthält {search_results}
(Suchergebnisse),{cur_date}
(aktuelles Datum) und {question}
(Benutzerfragen) Drei Schlüsselparameter.
DeepSeek bietet optimierte Vorlagen für chinesische und englische Abfragen:
- Chinesische Suchvorlage (search_answer_zh_template):
search_answer_zh_template = \
'''# 以下内容是基于用户发送的消息的搜索结果:
{search_results}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文,请列出所有相关的引用编号,例如[citation:3][citation:5],切记不要将引用集中在最后返回引用编号,而是在答案对应部分列出。
在回答时,请注意以下几点:
- 今天是{cur_date}。
- 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
- 对于列举类的问题(如列举所有航班信息),尽量将答案控制在10个要点以内,并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项;如非必要,不要主动告诉用户搜索结果未提供的内容。
- 对于创作类的问题(如写论文),请务必在正文的段落中引用对应的参考编号,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解读并概括用户的题目要求,选择合适的格式,充分利用搜索结果并抽取重要信息,生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长,对于每一个要点的论述要推测用户的意图,给出尽可能多角度的回答要点,且务必信息量大、论述详尽。
- 如果回答很长,请尽量结构化、分段落总结。如果需要分点作答,尽量控制在5个点以内,并合并相关的内容。
- 对于客观类的问答,如果问题的答案非常简短,可以适当补充一到两句相关信息,以丰富内容。
- 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
- 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
- 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{question}'''
- Englische Abfragevorlage (search_answer_en_template):
search_answer_en_template = \
'''# The following contents are the search results related to the user's message:
{search_results}
In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.
When responding, please keep the following points in mind:
- Today is {cur_date}.
- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.
- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.
- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.
- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.
- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.
- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.
- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.
- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:
{question}'''
Zusätzliche Leitlinien zur Gewährleistung der amtlichen Kohärenz:
Neben der strikten Einhaltung der offiziell bereitgestellten Prompt-Vorlagen und <think>\n
Zusätzlich zu den Anleitungen helfen die folgenden Leitlinien den Nutzern, die Leistung der offiziellen Plattform in ihrer lokalen Einsatzumgebung zu maximieren und sicherzustellen, dass ihre lokale DeepSeek-R1-Laufzeit so gut ist, wie sie nur sein kann:
- Mathematikaufgaben: Wie im vorigen Abschnitt ist es auch bei Mathematikaufgaben wichtig, das Modell in der Aufforderung ausdrücklich aufzufordern, "Schritt für Schritt zu denken" und die endgültige Antwort im offiziellen Format zu markieren, z. B. "Bitte denken Sie Schritt für Schritt und tragen Sie die endgültige Antwort in die \boxed{}" ein. \boxed{}". Achten Sie darauf, alle offiziellen Angaben zur Behandlung mathematischer Probleme zu befolgen, um sicherzustellen, dass das lokale Modell in Bezug auf die mathematische Rechenleistung vollständig mit der offiziellen Plattform übereinstimmt.
- Leistungsbewertung: Um genau zu beurteilen, ob der lokal eingesetzte DeepSeek-R1 die Leistung der offiziellen Plattform erfolgreich reproduziert, empfiehlt es sich, mehrere Tests durchzuführen und den Durchschnitt der Ergebnisse zu berechnen. Die Durchschnittsbildung der Ergebnisse mehrerer Tests verringert die mit einem einzelnen Test verbundenen Chancen und Fehler und bietet eine wissenschaftlichere und zuverlässigere Grundlage für die Ermittlung des Erfolgs einer lokalen Bereitstellung und für die Feinabstimmung. Die Strenge der Leistungsbewertung steht in direktem Zusammenhang mit der Wirksamkeit des lokalen Einsatzplans.
Zusammenfassungen
Befolgen Sie strikt alle von DeepSeek bereitgestellten Konfigurationsrichtlinien, insbesondere die Feinabstimmung der Verwendung der offiziellen Tipp-Vorlagen und der <think>\n
Die Anleitungen für Vordenker sind die grundlegende Garantie für Benutzer, die hervorragende Leistung der offiziellen DeepSeek-R1-Plattform in ihrer lokalen Umgebung zu reproduzieren, und die einzige Möglichkeit, die "ursprüngliche" DeepSeek-R1-Erfahrung zu erhalten. Wenn Sie die Modellarchitektur, die Trainingsmethodik und die Funktionsweise von DeepSeek-R1 verstehen und die offiziellen Empfehlungen in jedem Aspekt Ihres lokalen Einsatzes umsetzen, werden Sie in der Lage sein, die Konsistenz der Leistung zwischen Ihrem lokalen Modell und der offiziellen Plattform zu maximieren. Fangen Sie an, diese Richtlinien zu befolgen, um die offizielle DeepSeek-R1-Erfahrung in Ihrer lokalen Umgebung zu reproduzieren!