AI个人学习
和实操指南

使用 DeepSeek-R1 API 常见问题

本文于 2025-02-02 13:45 更新,部分内容具有时效性,如有失效,请留言

DeepSeek-R1 API

标准模型名称是:deepseek-reasoner


 

DeepSeek-R1 支持缓存命中

缓存命中一般用于高频输入少样本示例、大文档输入多次输出(不足 64 tokens 的内容不会被缓存)

输入部分system、user消息都会计入缓存命中

缓存命中有时效性,时间一般为几个小时到几天

缓存命中的 tokens 数(1 元 / 百万 tokens)

使用 DeepSeek-R1 API 常见问题-1

 

DeepSeek-R1 输出问题

DeepSeek-R1 输出包含思维链输出和答案输出两部分,两者都算输出 token 计价相同。

API 最大支持 64K 上下文,思维链不计入总长度。

思维链输出最大可设置(reasoning_effort) 32K tokens;答案输出最大可设置(max_tokens) 8K tokens。

 

DeepSeek-R1 上下文拼接

在每一轮对话过程中,模型会输出思维链内容(reasoning_content)和最终回答(content)。在下一轮对话中,之前轮输出的思维链内容不会被拼接到上下文中,如下图所示:

使用 DeepSeek-R1 API 常见问题-1

上下文总是保留最后一轮思维链,否则输出回答会混乱。

 

关于使用第三方 DeepSeek-R1 API

注意,与官方格式不兼容!例如硅基流动。

未经允许不得转载:首席AI分享圈 » 使用 DeepSeek-R1 API 常见问题

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文