DeepSeek-R1 공식 큐워드 및 파라미터 구성: 딥시크의 공식 성능으로 오픈 소스 671B 배포하기

67.5K 00

DeepSeek-R1 모델은 뛰어난 추론 능력으로 유명합니다. 사용자를 돕기 위해공식 DeepSeek 플랫폼 환경과 동일한 성능 제공의 공식 세부 배포 가이드가 공개되었습니다. 이 글에서는 이 가이드를 자세히 읽어보겠습니다.검색 및 파일 업로드 시나리오에 대한 프롬프트용으로 제공되는 공식 템플릿을 분석하고, 모델이 사고 단계를 건너뛰는 것을 완화하는 다양한 명령을 분석하는 데 중점을 둡니다.. 이러한 공식 구성을 숙지하고 엄격하게 따르는 것이 공식 DeepSeek-R1의 우수성을 재현하는 열쇠입니다!이 문서에서는 DeepSeek-R1을 로컬에 배포하려는 개발자와 모델 성능을 심층적으로 분석하려는 연구자 모두에게 중요한 참고자료를 제공합니다. 이 백서는 DeepSeek-R1을 로컬에 배포하려는 개발자이든 모델 성능을 심층적으로 분석하려는 연구자이든 관계없이 다음과 같은 중요한 참고자료를 제공합니다.DeepSeek-R1 경험은 공식 표준의 정확한 복제본입니다..

DeepSeek-R1 官方提示词和参数配置：部署开源671B与DeepSeek官方表现一致

DeepSeek-R1의 출시는 많은 개발자들이 이 강력한 추론 모델을 배포하고 적용하기 위해 적극적으로 노력하는 등 AI 기술 커뮤니티에서 많은 주목을 받고 있습니다. 사용자들이 우수한 경험을 할 수 있도록 돕기 위해 DeepSeek 팀은 공식 배포 가이드를 발표했습니다. 이 글에서는 가이드를 자세히 읽고 핵심 사항을 추출하고 모델 기능을 자세히 분석하여 독자가 DeepSeek-R1의 모범 사례를 완전히 이해하고 모델 성능 최적화의 핵심 기술을 습득하는 데 도움을 드리고자 합니다.

1. DeepSeek-R1 모델의 기술적 분석

DeepSeek 는 딥시크-R1-Zero와 딥시크-R1로 구성된 1세대 추론 모델을 출시했습니다. DeepSeek-R1-Zero는 대규모 강화 학습(RL)에만 의존해 훈련하는 기술 혁신으로, 사전 훈련 단계로 감독 미세 조정(SFT)이 필요했던 기존의 패러다임을 뒤집습니다. 이러한 접근 방식은 DeepSeek-R1-Zero에 뛰어난 추론 기능을 제공하여 추론 작업에서 탁월한 성능을 발휘하고 여러 가지 매력적인 추론 속성을 자연스럽게 드러낼 수 있게 해줍니다.

그러나 반복적인 출력, 가독성 저하, 일부 언어 혼용 등의 문제가 발생하는 등 DeepSeek-R1-Zero는 완벽하지 않습니다. 이러한 한계를 극복하고 모델의 추론 성능을 더욱 향상시키기 위해 DeepSeek 팀은 DeepSeek-R1을 도입했습니다. DeepSeek-R1-R1의 가장 큰 개선 사항은 강화 학습 전에 '콜드 스타트 데이터'를 통합한 것입니다. 이를 통해 수학, 코딩, 복잡한 추론 작업에서 모델의 성능이 효과적으로 향상되어 다음과 같은 OpenAI 모델과 비교할 수 있게 되었습니다. OpenAI-o1.

딥시크는 연구 커뮤니티에 보답하기 위해 딥시크-R1-R1-Zero, 딥시크-R1, 그리고 딥시크-R1에서 추출한 라마 및 퀀 아키텍처를 기반으로 하는 6개의 고밀도 모델을 아낌없이 오픈소스화했습니다. 특히, DeepSeek-R1-Distill-Qwen-32B는 여러 벤치마크에서 뛰어난 성능을 발휘합니다. OpenAI-o1-mini를 통해 소형 고밀도 모델에 대한 새로운 성능 벤치마크를 설정했습니다.

특별 팁: DeepSeek-R1 모델 제품군을 로컬에 배포하고 실행하기 전에 사용자는 "2. 핵심 구성 포인트"를 주의 깊게 읽고 최적의 사용을 보장할 것을 강력히 권장합니다. 공식 플랫폼의 일관된 경험을 최대한 재현합니다..

2. 핵심 구성 요소: 공식적으로 일관된 결과 재현

딥시크 공식 팀은 공식 모델 매개변수 구성 모범 사례를 기반으로 딥시크-R1의 배포 및 사용에 대한 다음과 같은 핵심 권장 사항을 제공했습니다. 사용자가 공식 데모 플랫폼과 일치하는 우수한 성능을 로컬 환경에서 재현하려면 이러한 구성을 엄격하게 준수하는 것이 핵심입니다. 무엇보다도 공식검색 및 파일 업로드 프롬프트 템플릿뿐만 아니라완화 모델 우회 사고이 가이드라인은 훨씬 더 중요하며 로컬에 배포된 DeepSeek-R1이 공식 표준을 충족할 수 있는지 여부를 직접적으로 결정합니다:

2.1 시스템 프롬프트가 없습니다:

DeepSeek-R1 모델은 시스템 프롬프트 없이 작동하도록 설계되었습니다. 공식 플랫폼과 일관성을 유지하고 원하는 모델 동작을 얻으려면 시스템 프롬프트를 비활성화하고 모든 지침을 사용자 프롬프트에 직접 포함시키는 것이 중요합니다. 명확하고 간결한 질문은 공식 플랫폼의 프롬프트 처리 방식과 일치하여 모델이 사용자의 의도를 정확하게 이해하는 데 도움이 됩니다.

2.1 온도 매개변수를 0.6으로 설정합니다(온도: 0.6):

온도 매개변수는 모델 출력의 무작위성과 창의성에 직접적인 영향을 줍니다. 이 매개변수는 로컬에 배포된 모델의 출력 스타일이 공식 플랫폼의 출력 스타일과 일관성을 유지하여 창의성과 출력의 일관성 사이의 이상적인 균형을 맞추기 위한 핵심 매개변수 중 하나인 0.6으로 설정하는 것이 공식 권장 사항입니다. 값이 낮을수록 보수적이고 결정론적인 모델 출력이, 값이 높을수록 모델이 더 다양하고 참신한 답변을 생성하도록 장려하지만 공식 온도 설정에서 벗어나면 로컬 모델과 공식 플랫폼 간의 응답 스타일에 차이가 발생할 수 있습니다.

2.3 모델 우회 사고를 완화하기 위한 가이드라인:

복잡한 쿼리를 처리할 때 DeepSeek-R1 모델이 충분히 이성적인 사고를 하도록 하려면 사용자가 각 입력 프롬프트의 시작 부분에 명시적인 사고 리더십 지침을 추가하는 것이 좋습니다. <think>\n. 이는 모델이 사고 단계를 건너뛰는 것을 완화하는 효과적인 수단일 뿐만 아니라 로컬로 배포된 모델이 공식 플랫폼과 동일한 깊이의 추론을 재현할 수 있도록 하는 핵심 구성이기도 합니다. 이 지시어를 무시하거나 오용하면 복잡한 추론 작업에서 로컬 모델이 공식 플랫폼에서 벗어날 수 있습니다. 이 지시어는 모델을 "사고 모드"로 효과적으로 안내하고 모델이 충분한 추론 없이 결과를 출력하는 것을 방지합니다. 즉, "사고 단계를 건너뛰는 것"(예 <think>\n\n</think> ).

2.4. 수학 문제 최적화

수학 문제의 경우 로컬로 배포된 환경에서 공식 플랫폼과 일치하는 정확한 답을 얻으려면 힌트에서 모델에 "단계별로 추론"하도록 명시적으로 요청하고 최종 답의 형식을 힌트에 명시하는 것이 좋습니다(예: "단계별로 추론하고 최종 답은 \boxed{}에 넣어주세요"). ". 명확한 지침과 형식 요구 사항은 모델이 문제 유형을 더 잘 이해하고 적절한 해결 전략을 채택하는 데 도움이 되며, 로컬 모델의 수학 문제 풀이 능력이 공식 플랫폼과 일치하도록 보장합니다.

2.5 성능 평가

로컬에 배포된 DeepSeek-R1과 공식 플랫폼 간의 성능 차이를 객관적으로 비교하려면 여러 테스트를 수행하고 여러 테스트 결과의 평균을 계산하여 보다 신뢰할 수 있는 성능 평가 데이터를 얻는 것이 좋습니다. 단일 테스트의 결과는 우연의 영향을 받을 수 있지만, 여러 테스트의 결과를 평균화하면 모델의 실제 수준을 더 정확하게 반영하고 사용자가 로컬 배포가 공식 성능을 성공적으로 재현했는지 평가할 수 있는 과학적 근거를 제공할 수 있습니다.

2.6 검색 및 파일 업로드를 위한 공식 프롬프트

공식 DeepSeek 배포는 오픈 소스 버전과 동일한 DeepSeek-R1 모델을 사용합니다. 로컬로 배포된 DeepSeek-R1 모델이 공식 DeepSeek-R1 모델과 동일한 사용자 경험을 제공하고 특정 시나리오에서 DeepSeek-R1 모델의 성능을 극대화하기 위해, 웹에서 파일 업로드 및 검색의 가장 일반적인 두 가지 시나리오를 위해 특별히 설계 및 조정된 큐잉 템플릿이 DeepSeek-R1 모델에 제공되었습니다. 이러한 공식 프롬프트 템플릿을 완전히 채택하고 올바르게 사용하는 것은 로컬에 배포된 DeepSeek-R1이 공식 플랫폼의 성능을 재현하기 위한 가장 중요한 보장입니다. 큐 템플릿을 수정하거나 조정하면 로컬 모델이 특정 작업에서 공식 플랫폼의 성능에서 벗어날 수 있습니다.

1. 파일 업로드 시나리오 프롬프트 템플릿을 선택합니다.

파일을 업로드하고 모델이 파일 내용에 따라 질문에 답변하도록 하려면 사용자는 다음 공식 템플릿을 사용하여 프롬프트를 엄격하게 구성해야 합니다. 무엇보다도{file_name}및{file_content} 노래로 응답 {question} 이 세 개의 자리 표시자는 사용자가 업로드한 파일의 이름, 파일의 내용, 사용자가 질문한 내용을 나타냅니다:

file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""

2. 웹 검색 시나리오 팁 템플릿(웹 검색).

사용자가 웹 검색 결과에 대한 답변이 필요한 질문을 하는 경우 다음의 공식 웹 검색 팁 템플릿을 사용하세요. 이 템플릿에는 다음이 포함됩니다. {search_results} (검색 결과),{cur_date} (현재 날짜) 및 {question} (사용자 문제) 세 가지 주요 매개변수.

DeepSeek는 중국어 및 영어 쿼리에 최적화된 템플릿을 제공합니다:

중국어 검색 템플릿(search_answer_zh_template):

search_answer_zh_template = \
'''# 以下内容是基于用户发送的消息的搜索结果:
{search_results}
在我给你的搜索结果中，每个结果都是[webpage X begin]...[webpage X end]格式的，X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文，请列出所有相关的引用编号，例如[citation:3][citation:5]，切记不要将引用集中在最后返回引用编号，而是在答案对应部分列出。
在回答时，请注意以下几点：
- 今天是{cur_date}。
- 并非搜索结果的所有内容都与用户的问题密切相关，你需要结合问题，对搜索结果进行甄别、筛选。
- 对于列举类的问题（如列举所有航班信息），尽量将答案控制在10个要点以内，并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项；如非必要，不要主动告诉用户搜索结果未提供的内容。
- 对于创作类的问题（如写论文），请务必在正文的段落中引用对应的参考编号，例如[citation:3][citation:5]，不能只在文章末尾引用。你需要解读并概括用户的题目要求，选择合适的格式，充分利用搜索结果并抽取重要信息，生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长，对于每一个要点的论述要推测用户的意图，给出尽可能多角度的回答要点，且务必信息量大、论述详尽。
- 如果回答很长，请尽量结构化、分段落总结。如果需要分点作答，尽量控制在5个点以内，并合并相关的内容。
- 对于客观类的问答，如果问题的答案非常简短，可以适当补充一到两句相关信息，以丰富内容。
- 你需要根据用户要求和回答内容选择合适、美观的回答格式，确保可读性强。
- 你的回答应该综合多个相关网页来回答，不能重复引用一个网页。
- 除非用户要求，否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为：
{question}'''

영어 쿼리 템플릿(search_answer_en_template):

search_answer_en_template = \
'''# The following contents are the search results related to the user's message:
{search_results}
In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.
When responding, please keep the following points in mind:
- Today is {cur_date}.
- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.
- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.
- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.
- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.
- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.
- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.
- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.
- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:
{question}'''

공식적인 일관성을 지키기 위한 추가 가이드라인입니다:

공식적으로 제공된 프롬프트 템플릿을 엄격하게 따르는 것 외에도 <think>\n 지침 외에도 다음 추가 지침은 사용자가 로컬 배포 환경에서 공식 플랫폼의 성능을 극대화하여 로컬 DeepSeek-R1이 '있는 그대로' 실행되도록 하는 데 도움이 됩니다:

수학 문제: 이전 섹션과 마찬가지로 수학 문제의 경우, 모델에게 프롬프트에서 '단계별 추론'을 수행하도록 명시적으로 요청하고 최종 답은 공식 형식을 사용하여 표시하는 것이 중요합니다(예: "단계별로 추론하고 최종 답은 \boxed{}에 입력하세요"). \boxed{}". 로컬 모델이 수학적 연산 능력 측면에서 공식 플랫폼과 완전히 일치하는지 확인하기 위해 수학 문제 처리에 관한 모든 공식 세부 사항을 준수해야 합니다.
성능 평가: 로컬에 배포된 DeepSeek-R1이 공식 플랫폼의 성능을 성공적으로 재현하는지 정확하게 평가하기 위해 여러 차례 테스트를 수행하고 결과의 평균을 계산하는 것이 좋습니다. 여러 테스트의 결과를 평균화하면 단일 테스트와 관련된 기회와 오류가 줄어들고 로컬 배포의 성공 여부를 판단하고 미세 조정을 위한 보다 과학적이고 신뢰할 수 있는 근거를 제공합니다. 성능 평가의 엄격성은 로컬 배포 계획의 효과와 직접적인 관련이 있습니다.

요약

딥서치에서 제공하는 모든 구성 가이드라인을 엄격하게 따르고, 특히 공식 팁 템플릿과 <think>\n 사고 리더십 지침은 사용자가 로컬 환경에서 공식 DeepSeek-R1 플랫폼의 우수한 성능을 재현할 수 있는 근본적인 보장이며, "오리지널" DeepSeek-R1 경험을 얻을 수 있는 유일한 방법입니다. DeepSeek-R1의 모델 아키텍처, 훈련 방법론 및 작동 방식을 이해하고 공식 권장 사항을 로컬 배포의 모든 측면에 구현함으로써 로컬 모델과 공식 플랫폼 간의 성능 일관성을 최대화할 수 있습니다. 이 가이드라인을 실천하여 로컬 환경에서 공식 DeepSeek-R1 경험을 재현해 보세요!