Использование API DeepSeek-R1 Часто задаваемые вопросы

Ответы ИИОбновлено 11 месяцев назад Круг обмена ИИ

API DeepSeek-R1

Стандартное название модели: deepseek-reasoner

DeepSeek-R1 поддерживает кэш-хиты

Кэш-хиты обычно используются для высокочастотных входов с небольшим количеством примеров, больших входов документов с несколькими выходами (менее 64 жетоны (содержимое которого не будет кэшироваться)

Входная часть системных и пользовательских сообщений учитывается как попадание в кэш.

Попадания в кэш чувствительны к времени, обычно от нескольких часов до нескольких дней.

Количество токенов, попавших в кэш ($1/миллион токенов)

Проблемы с выходом DeepSeek-R1

DeepSeek-R1 Вывод состоит как из вывода цепочки мыслей, так и из вывода ответа, оба из которых считаются выводом жетон Счета выставляются одинаково.

API поддерживает до 64K контекстов, и цепочки мыслей не учитываются при подсчете общей длины.

Вывод цепочки мыслей может быть установлен на максимум (reasoning_effort) в 32K токенов; вывод ответа может быть установлен на максимум (max_tokens) в 8K токенов.

Контекстный сплайсинг DeepSeek-R1

Во время каждого раунда диалога модель выдает содержание цепочки мыслей (reasoning_content) и окончательный ответ (content). В следующем раунде диалога содержимое цепочки мыслей, выведенной в предыдущем раунде, не вставляется в контекст, как показано ниже:

Контекст всегда сохраняет последний виток цепочки размышлений, иначе выходной ответ будет сбит с толку.

Об использовании стороннего API DeepSeek-R1

Обратите внимание на несовместимость с официальными форматами! Например, поток на основе кремния.