Использование API DeepSeek-R1 Часто задаваемые вопросы
API DeepSeek-R1
Стандартное название модели: deepseek-reasoner
DeepSeek-R1 поддерживает кэш-хиты
Кэш-хиты обычно используются для высокочастотных входов с небольшим количеством примеров, больших входов документов с несколькими выходами (менее 64 жетоны (содержимое которого не будет кэшироваться)
Входная часть системных и пользовательских сообщений учитывается как попадание в кэш.
Попадания в кэш чувствительны к времени, обычно от нескольких часов до нескольких дней.
Количество токенов, попавших в кэш ($1/миллион токенов)

Проблемы с выходом DeepSeek-R1
DeepSeek-R1 Вывод состоит как из вывода цепочки мыслей, так и из вывода ответа, оба из которых считаются выводом жетон Счета выставляются одинаково.
API поддерживает до 64K контекстов, и цепочки мыслей не учитываются при подсчете общей длины.
Вывод цепочки мыслей может быть установлен на максимум (reasoning_effort) в 32K токенов; вывод ответа может быть установлен на максимум (max_tokens) в 8K токенов.
Контекстный сплайсинг DeepSeek-R1
Во время каждого раунда диалога модель выдает содержание цепочки мыслей (reasoning_content
) и окончательный ответ (content
). В следующем раунде диалога содержимое цепочки мыслей, выведенной в предыдущем раунде, не вставляется в контекст, как показано ниже:

Контекст всегда сохраняет последний виток цепочки размышлений, иначе выходной ответ будет сбит с толку.
Об использовании стороннего API DeepSeek-R1
Обратите внимание на несовместимость с официальными форматами! Например, поток на основе кремния.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...