DeepSeek-R1 API 사용 자주 묻는 질문

79.1K 00

DeepSeek-R1 API

표준 모델명: deepseek-reasoner

DeepSeek-R1은 캐시 히트를 지원합니다.

캐시 히트는 일반적으로 샘플 예제가 적은 빈도가 높은 입력, 여러 출력이 있는 큰 문서 입력(64개 미만)에 사용됩니다. 토큰 (콘텐츠는 캐시되지 않습니다.)

시스템 및 사용자 메시지의 입력 부분은 캐시 히트로 계산됩니다.

캐시 히트는 일반적으로 몇 시간에서 며칠까지 시간에 따라 달라집니다.

캐시에 도달한 토큰 수(1달러/백만 토큰)

DeepSeek-R1 출력 문제

DeepSeek-R1 출력은 사고 체인 출력과 답변 출력으로 구성되며, 둘 다 출력으로 간주됩니다. 토큰 청구는 동일합니다.

API는 최대 64K 컨텍스트를 지원하며, 사고 체인은 총 길이에 포함되지 않습니다.

사고 체인 출력은 최대 32K 토큰으로 설정할 수 있으며(reasoning_effort), 답변 출력은 최대 8K 토큰으로 설정할 수 있습니다(max_tokens).

DeepSeek-R1 컨텍스트 스플라이싱

각 대화 라운드 동안 모델은 사고 체인 콘텐츠를 출력합니다(reasoning_content) 및 최종 답변(content). 다음 대화 라운드에서는 아래와 같이 이전 라운드에서 출력된 사고 사슬의 내용이 컨텍스트에 연결되지 않습니다:

컨텍스트는 항상 사고의 마지막 단계를 유지하며, 그렇지 않으면 출력 답변이 혼란스러워집니다.

타사 DeepSeek-R1 API 사용 정보

공식 형식과의 비호환성에 유의하세요! 예를 들어, 실리콘 기반 흐름.

3 개월 전

019.4K

1 년 전

088.9K

7개월 전

035.7K

6개월 전

029.4K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

댓글 없음...