この記事は2025-02-02 13:45に更新されました。内容の一部は時間的制約があります!
DeepSeek-R1 API
標準的なモデル名は、deepseek-reasonerである。
DeepSeek-R1はキャッシュヒットをサポートします。
キャッシュヒットは一般的に、サンプル例の少ない高頻度の入力、複数の出力を持つ大規模な文書入力(64トークン未満はキャッシュされない)に使用されます。
システム・メッセージとユーザー・メッセージの入力部分はキャッシュ・ヒットとしてカウントされる。
キャッシュ・ヒットは時間的制約があり、通常、数時間から数日間である。
キャッシュにヒットしたトークン数($1/100万トークン)
DeepSeek-R1出力の問題
ディープシーク-R1 出力は、思考連鎖出力と解答出力の両方で構成され、どちらも出力としてカウントされる。 トークン 請求は同じだ。
APIは最大64Kのコンテクストをサポートし、思考連鎖は合計長にカウントされない。
思考連鎖の出力は最大(reasoning_effort)32Kトークンに設定でき、答えの出力は最大(max_tokens)8Kトークンに設定できる。
DeepSeek-R1 コンテキスト・スプライシング
各ラウンドの対話中、モデルは思考連鎖の内容(推論
)と最終的な答え(内容
).次のラウンドの対話では、以下のように、前のラウンドで出力された思考連鎖の内容は文脈に継ぎ接ぎされない:
コンテキストは常に思考の連鎖の最後のラウンドを保持する。
サードパーティ DeepSeek-R1 API の使用について
公式フォーマットとの非互換性に注意!例えば、シリコンベースのフロー。