本文于 2025-02-02 13:45 更新,部分内容具有时效性,如有失效,请留言
DeepSeek-R1 API
标准模型名称是:deepseek-reasoner
DeepSeek-R1 支持缓存命中
缓存命中一般用于高频输入少样本示例、大文档输入多次输出(不足 64 tokens 的内容不会被缓存)
输入部分system、user消息都会计入缓存命中
缓存命中有时效性,时间一般为几个小时到几天
缓存命中的 tokens 数(1 元 / 百万 tokens)
DeepSeek-R1 输出问题
DeepSeek-R1 输出包含思维链输出和答案输出两部分,两者都算输出 token 计价相同。
API 最大支持 64K 上下文,思维链不计入总长度。
思维链输出最大可设置(reasoning_effort) 32K tokens;答案输出最大可设置(max_tokens) 8K tokens。
DeepSeek-R1 上下文拼接
在每一轮对话过程中,模型会输出思维链内容(reasoning_content
)和最终回答(content
)。在下一轮对话中,之前轮输出的思维链内容不会被拼接到上下文中,如下图所示:
上下文总是保留最后一轮思维链,否则输出回答会混乱。
关于使用第三方 DeepSeek-R1 API
注意,与官方格式不兼容!例如硅基流动。