DeepSeek-R1 API
표준 모델명: deepseek-reasoner
DeepSeek-R1은 캐시 히트를 지원합니다.
캐시 히트는 일반적으로 샘플 예제가 적은 빈도가 높은 입력, 여러 출력이 있는 큰 문서 입력(64개 미만)에 사용됩니다. 토큰 (콘텐츠는 캐시되지 않습니다.)
시스템 및 사용자 메시지의 입력 부분은 캐시 히트로 계산됩니다.
캐시 히트는 일반적으로 몇 시간에서 며칠까지 시간에 따라 달라집니다.
캐시에 도달한 토큰 수(1달러/백만 토큰)

DeepSeek-R1 출력 문제
DeepSeek-R1 출력은 사고 체인 출력과 답변 출력으로 구성되며, 둘 다 출력으로 간주됩니다. 토큰 청구는 동일합니다.
API는 최대 64K 컨텍스트를 지원하며, 사고 체인은 총 길이에 포함되지 않습니다.
사고 체인 출력은 최대 32K 토큰으로 설정할 수 있으며(reasoning_effort), 답변 출력은 최대 8K 토큰으로 설정할 수 있습니다(max_tokens).
DeepSeek-R1 컨텍스트 스플라이싱
각 대화 라운드 동안 모델은 사고 체인 콘텐츠를 출력합니다(reasoning_content
) 및 최종 답변(content
). 다음 대화 라운드에서는 아래와 같이 이전 라운드에서 출력된 사고 사슬의 내용이 컨텍스트에 연결되지 않습니다:

컨텍스트는 항상 사고의 마지막 단계를 유지하며, 그렇지 않으면 출력 답변이 혼란스러워집니다.
타사 DeepSeek-R1 API 사용 정보
공식 형식과의 비호환성에 유의하세요! 예를 들어, 실리콘 기반 흐름.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...