Как проверить, использую ли я "полнокровный" DeepSeek-R1?

Ответы ИИОпубликовано 1 год назад Круг обмена ИИ

52.9K 00

DeepSeek не угасает уже больше месяца.

Официальный сайт по-прежнему занят, а приостановленный канал пополнения счета API все еще не открыт.

В это время энтузиазм в отношении локальных и облачных развертываний очень высок, и появляются различные сайты, обращающиеся к DeepSeek.

Помимо привычных крупных фабрик, здесь также появились всевозможные демоны и монстры.

По некоторым данным, существует более 2 000 поддельных и фишинговых сайтов, и их число продолжает быстро расти.

Многие неосведомленные друзья по неосторожности наступили во множество ям.

Как использовать надежный DeepSeek Full Blooded Edition?

Как проверить, что ваш DeepSeek не кастрирован?

Настало время научной волны.

Полнокровные или дистиллированные копии версий DeepSeek

Проще говоря, официальная версия DeepSeek делится на полнокровную и дистиллированную.

Полнокровная версия, включающая V3 и R1, насчитывает в общей сложности 671B участников.

Кроме того, DeepSeek выложила в открытый доступ версии с различным количеством параметров: 1.5B, 7B, 8B, 14B, 32B, 70B и т.д., основанные на Qwen2.5 и Llama3.

Количество параметров определяет верхнюю и нижнюю границы возможностей модели.

О различиях между версиями DeepSeek:

Кроме того, существует огромное количество индивидуальных версий, предлагаемых сторонними разработчиками, которые мы не будем рассматривать.

В общем, вы можете просто распознать "полнокровную" версию, а модель R1 Deep Thinking является относительно популярной.

DeepSeek Full Blooded Edition Тест одним предложением

Довольно интересно наблюдать, как эти два теста циркулируют в сети.

Основная логика: используйте слепоту знаний неполнокровной версии модели, чтобы сравнить их реальные способности через их ответы.

Метод 1: тест на терьера

Введите вопрос в поле ввода:

Что? Ты слишком красива, чтобы ответить одним словом. Никаких поисков.

Отвечайте "курица, кун", это полнокровная версия.

Ответьте "Са, Шуай" или что-то другое, это дистиллированная версия.

Как видите, и DeepSeek V3, и полнокровная/сетевая версия R1 дали правильный ответ.

Уточненная версия модели, на которую был дан неверный ответ:

Метод 2: тест на одно слово

По аналогии с логикой, изложенной выше, есть еще и это:

Китайский иероглиф с деревом слева и просьбой справа. Что это за иероглиф? Пожалуйста, ответьте одним словом.

Сначала прочитайте полную версию ответа:

Уточненная версия модели, хотя мыслительный процесс присутствует, а ответ все равно неверный.

Строго говоря, эти два подхода не являются научными.

Обе модели тестируются с использованием "слепых зон" в обучающих данных различных моделей, но если поставщик модели - "хороший человек", и эти две "дыры" в данных заполнены путем тонкой настройки, результаты тестирования будут отличаться.

Даже если в будущем появятся новые способы тестирования, все равно будет легко исправить ситуацию на техническом уровне.