DeepSeek-R1 Official Cue Words and Parameter Configurations : Déploiement de l'Open Source 671B avec la performance officielle de DeepSeek

Nouvelles de l'IAMise à jour il y a 7 mois Cercle de partage de l'IA
10.2K 00

Profondeur de l'eau-R1 Les modèles sont réputés pour leurs capacités de raisonnement supérieures. Pour aider les utilisateursObtenez les mêmes performances que l'expérience officielle de la plateforme DeepSeekUn guide de déploiement officiel et détaillé a été publié. Dans cet article, nous allons lire ce guide en profondeur.L'accent est mis sur la dissection des modèles officiels fournis pour les invites de recherche et les scénarios de téléchargement de fichiers, ainsi que sur les diverses commandes qui permettent aux modèles de sauter l'étape de la réflexion.Maîtriser et suivre strictement ces configurations officielles est la clé pour reproduire l'excellence officielle du DeepSeek-R1 !Cet article fournira une référence critique pour les développeurs cherchant à déployer DeepSeek-R1 localement et les chercheurs cherchant à plonger dans la performance du modèle. Que vous soyez un développeur cherchant à déployer DeepSeek-R1 localement ou un chercheur travaillant sur une étude plus approfondie de la performance des modèles, cet article vous fournira une référence critique pour vous aider àL'expérience DeepSeek-R1 est une réplique précise de la norme officielle..

DeepSeek-R1 官方提示词和参数配置:部署开源671B与DeepSeek官方表现一致

La sortie de DeepSeek-R1 a attiré beaucoup d'attention dans la communauté de la technologie de l'IA, avec de nombreux développeurs essayant activement de déployer et d'appliquer ce puissant modèle d'inférence. Afin d'aider les utilisateurs à obtenir une excellente expérience, l'équipe DeepSeek a publié un guide de déploiement officiel. Dans cet article, nous allons lire le guide en profondeur, extraire les points essentiels et analyser les caractéristiques du modèle en détail, afin d'aider les lecteurs à comprendre les meilleures pratiques de DeepSeek-R1 et à maîtriser les techniques clés d'optimisation des performances du modèle.

 

1) Analyse technique du modèle DeepSeek-R1

DeepSeek a présenté sa première génération de modèles d'inférence, composée de DeepSeek-R1-Zero et DeepSeek-R1. DeepSeek-R1-Zero est une innovation technologique qui s'appuie exclusivement sur l'apprentissage par renforcement (RL) à grande échelle pour l'entraînement, inversant le paradigme traditionnel qui exige un réglage fin supervisé (SFT) comme étape de pré-entraînement. Cette approche confère à DeepSeek-R1-Zero des capacités d'inférence supérieures, lui permettant d'exceller dans les tâches d'inférence et d'émerger naturellement avec un certain nombre de propriétés d'inférence convaincantes.

Cependant, DeepSeek-R1-Zero n'est pas parfait, par exemple, il souffre de résultats répétitifs, d'une mauvaise lisibilité et d'un mélange de langues dans certains cas. Pour surmonter ces limites et améliorer encore les performances du modèle en matière d'inférence, l'équipe DeepSeek a introduit DeepSeek-R1. La principale amélioration de DeepSeek-R1 par rapport à DeepSeek-R1-Zero est l'incorporation de "données de démarrage à froid" avant l'apprentissage par renforcement. Cela permet d'améliorer efficacement les performances du modèle pour les tâches de mathématiques, de codage et de raisonnement complexe, ce qui le rend comparable aux modèles OpenAI tels que OpenAI-o1.

Pour rendre la pareille à la communauté des chercheurs, DeepSeek a généreusement mis à disposition DeepSeek-R1-Zero, DeepSeek-R1 et six modèles denses basés sur les architectures Llama et Qwen distillées à partir de DeepSeek-R1. Notamment, DeepSeek-R1-Distill-Qwen-32B surpasse, dans plusieurs tests de référence, le modèle OpenAI-o1-miniétablissant ainsi un nouveau critère de performance pour les petits modèles denses.

Conseil spécial : Avant de déployer et d'utiliser localement les modèles de la famille DeepSeek-R1, il est fortement recommandé aux utilisateurs de lire attentivement la section "2. Points de configuration de base" afin de garantir une utilisation optimale du système. et reproduire autant que possible l'expérience cohérente de la plateforme officielle.

2) Éléments de configuration de base : reproduire des résultats officiellement cohérents

L'équipe officielle de DeepSeek a fourni les recommandations de base suivantes pour le déploiement et l'utilisation de DeepSeek-R1, qui sont basées sur les meilleures pratiques pour la configuration des paramètres du modèle officiel. Le respect strict de ces configurations est essentiel pour que les utilisateurs reproduisent d'excellentes performances dans leurs environnements locaux qui sont cohérentes avec la plateforme de démonstration officielle. Entre autres, le modèle officielModèle d'invite de recherche et de téléchargement de fichiersainsi queLes modèles d'atténuation contournent la réflexionLes lignes directrices sont encore plus critiques et déterminent directement si un DeepSeek-R1 déployé localement sera en mesure de répondre aux normes officielles :

2.1 Pas d'invite du système :

Le modèle DeepSeek-R1 est conçu pour fonctionner sans invites système. Afin d'être cohérent avec la plateforme officielle et d'obtenir le comportement souhaité du modèle, il est important de désactiver les invites du système et d'inclure toutes les instructions directement dans l'invite de l'utilisateur. Une question claire et concise aidera le modèle à comprendre avec précision l'intention de l'utilisateur, conformément à la manière dont la plate-forme officielle traite les messages-guides.

2.1 Régler le paramètre de température sur 0,6 (Température : 0,6) :

Le paramètre Température affecte directement le caractère aléatoire et la créativité de la sortie du modèle. La recommandation officielle est de fixer ce paramètre à 0,6, ce qui est l'un des paramètres clés pour s'assurer que le style de sortie des modèles déployés localement est cohérent avec celui de la plateforme officielle, en trouvant un équilibre idéal entre la créativité et la cohérence de la sortie. Des valeurs plus faibles se traduiront par un modèle plus conservateur et déterministe, tandis que des valeurs plus élevées encourageront le modèle à produire des réponses plus variées et nouvelles, mais les écarts par rapport à la température officielle peuvent entraîner des différences dans le style de réponse entre le modèle local et la plateforme officielle.

2.3 Lignes directrices pour atténuer la pensée de contournement du modèle :

Afin de s'assurer que le modèle DeepSeek-R1 s'engage dans une réflexion raisonnée suffisante lors du traitement de requêtes complexes, il est fortement recommandé aux utilisateurs d'ajouter des instructions explicites de conduite de la réflexion au début de chaque demande d'entrée. <think>\n. Il s'agit non seulement d'un moyen efficace d'empêcher les modèles de sauter des étapes de réflexion, mais aussi d'une configuration de base pour garantir que les modèles déployés localement peuvent reproduire la même profondeur de raisonnement que la plateforme officielle. Ignorer ou mal utiliser cette directive peut amener les modèles locaux à s'écarter de la plateforme officielle dans des tâches de raisonnement complexes. Cette directive guide efficacement le modèle en "mode réflexion" et l'empêche de produire des résultats sans raisonnement suffisant, c'est-à-dire qu'elle évite de "sauter l'étape de réflexion" (par exemple, produire directement les résultats de l'étape de réflexion). <think>\n\n</think> ).

2.4 Optimisation pour les problèmes mathématiques

Pour les questions de mathématiques, afin d'obtenir des réponses précises dans un environnement déployé localement et conformes à la plate-forme officielle, il est recommandé de demander explicitement au modèle de "raisonner étape par étape" dans les indices et de spécifier le format de la réponse finale dans les indices, par exemple "Veuillez raisonner étape par étape et mettre la réponse finale dans \boxed{}". ". Des instructions claires et des exigences de formatage aident les modèles à mieux comprendre les types de problèmes et à adopter des stratégies de solution appropriées, garantissant que la capacité du modèle local à répondre à des problèmes de mathématiques est alignée sur la plate-forme officielle.

2.5 Évaluation des performances

Afin de comparer objectivement la différence de performance entre DeepSeek-R1 déployé localement et la plateforme officielle, il est recommandé d'effectuer plusieurs tests et de calculer la moyenne des résultats de ces tests afin d'obtenir des données d'évaluation de la performance plus fiables. Alors que les résultats d'un seul test peuvent être aléatoires, la moyenne des résultats de plusieurs tests peut refléter plus précisément le niveau réel du modèle et fournir une base scientifique permettant aux utilisateurs d'évaluer si le déploiement local a reproduit avec succès la performance officielle.

2.6 Invitations officielles à la recherche et au téléchargement de fichiers

Le déploiement officiel de DeepSeek utilise le même modèle DeepSeek-R1 que la version open source. Afin de s'assurer que le modèle DeepSeek-R1 déployé localement a la même expérience utilisateur que le modèle officiel DeepSeek-R1 et pour maximiser la performance du modèle DeepSeek-R1 dans des scénarios spécifiques, le modèle DeepSeek-R1 a été fourni avec des modèles de signaux spécialement conçus et réglés pour les deux scénarios les plus courants de téléchargement de fichiers et de recherche sur le web. L'adoption complète et l'utilisation correcte de ces modèles d'invite officiels constituent la garantie la plus importante pour que DeepSeek-R1 déployé localement reproduise les performances de la plateforme officielle. Toute modification ou ajustement des modèles d'invite peut amener le modèle local à s'écarter des performances de la plateforme officielle pour des tâches spécifiques.

1. télécharger le fichier du modèle d'invite de scénario.

Lorsqu'ils téléchargent un fichier et qu'ils souhaitent que le modèle réponde à des questions basées sur le contenu du fichier, les utilisateurs doivent construire les messages-guides en utilisant strictement le modèle officiel suivant. Entre autres, le modèle{file_name},{file_content} répondre en chantant {question} Ces trois espaces représentent le nom du fichier téléchargé par l'utilisateur, le contenu du fichier et la question posée par l'utilisateur :

file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""

2. modèle de conseil pour un scénario de recherche sur le web (recherche sur le web).

Lorsqu'un utilisateur pose une question à laquelle il faut répondre à l'aide des résultats d'une recherche sur le web, veillez à utiliser le modèle officiel suivant de conseil sur la recherche sur le web. Ce modèle contient {search_results} (résultats de la recherche),{cur_date} (date actuelle) et {question} (questions relatives à l'utilisateur) Trois paramètres clés.

DeepSeek fournit des modèles optimisés pour les requêtes en chinois et en anglais :

  • Modèle de recherche en chinois (search_answer_zh_template) :
search_answer_zh_template = \
'''# 以下内容是基于用户发送的消息的搜索结果:
{search_results}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文,请列出所有相关的引用编号,例如[citation:3][citation:5],切记不要将引用集中在最后返回引用编号,而是在答案对应部分列出。
在回答时,请注意以下几点:
- 今天是{cur_date}。
- 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
- 对于列举类的问题(如列举所有航班信息),尽量将答案控制在10个要点以内,并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项;如非必要,不要主动告诉用户搜索结果未提供的内容。
- 对于创作类的问题(如写论文),请务必在正文的段落中引用对应的参考编号,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解读并概括用户的题目要求,选择合适的格式,充分利用搜索结果并抽取重要信息,生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长,对于每一个要点的论述要推测用户的意图,给出尽可能多角度的回答要点,且务必信息量大、论述详尽。
- 如果回答很长,请尽量结构化、分段落总结。如果需要分点作答,尽量控制在5个点以内,并合并相关的内容。
- 对于客观类的问答,如果问题的答案非常简短,可以适当补充一到两句相关信息,以丰富内容。
- 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
- 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
- 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{question}'''
  • Modèle de requête en anglais (search_answer_en_template) :
search_answer_en_template = \
'''# The following contents are the search results related to the user's message:
{search_results}
In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.
When responding, please keep the following points in mind:
- Today is {cur_date}.
- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.
- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.
- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.
- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.
- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.
- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.
- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.
- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:
{question}'''

Lignes directrices supplémentaires pour garantir la cohérence des fonctionnaires :

En plus de suivre strictement les modèles de messages officiels et de <think>\n En plus des instructions, les lignes directrices supplémentaires suivantes aideront les utilisateurs à maximiser les performances de la plateforme officielle dans leur environnement de déploiement local, garantissant que leur exécution locale de DeepSeek-R1 est "aussi bonne qu'elle peut l'être" :

  • Problèmes mathématiques : Comme dans la section précédente, il est important, pour les problèmes mathématiques, de demander explicitement au modèle d'effectuer un "raisonnement étape par étape" dans l'invite et de noter la réponse finale en utilisant le format officiel, par exemple "Veuillez raisonner étape par étape et placer la réponse finale dans l'encadré{}". \Encadré{}". Veillez à respecter tous les détails officiels concernant le traitement des problèmes mathématiques afin de garantir que le modèle local est entièrement compatible avec la plate-forme officielle en termes de puissance de calcul mathématique.
  • Évaluation des performances : afin d'évaluer avec précision si le déploiement local de DeepSeek-R1 reproduit avec succès les performances de la plateforme officielle, il est recommandé d'effectuer plusieurs tests et de calculer la moyenne des résultats. Le calcul de la moyenne des résultats de plusieurs tests réduit les risques et les erreurs associés à un seul test, et fournit une base plus scientifique et plus fiable pour déterminer le succès d'un déploiement local et pour procéder à des ajustements. La rigueur de l'évaluation des performances est directement liée à l'efficacité du plan de déploiement local.

 

résumés

Suivez strictement toutes les directives de configuration fournies par DeepSeek, en particulier en affinant l'utilisation des modèles de conseils officiels et de l'option <think>\n Les instructions sont la garantie fondamentale pour les utilisateurs de reproduire l'excellente performance de la plateforme officielle DeepSeek-R1 dans leur environnement local, et la seule façon d'obtenir l'expérience "originale" de DeepSeek-R1. En comprenant l'architecture du modèle DeepSeek-R1, la méthodologie de formation et le fonctionnement, et en mettant en œuvre les recommandations officielles dans chaque aspect de votre déploiement local, vous serez en mesure de maximiser la cohérence de la performance entre votre modèle local et la plate-forme officielle. Commencez à mettre en pratique ces lignes directrices pour reproduire l'expérience officielle de DeepSeek-R1 dans votre environnement local !

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...