Вчера компания DeepSeek выпустила DeepSeek-R1Предварительный просмотр -Lite, программы, которая работает с o1 конкурирующих макроязыковых моделей автономных рассуждений и представляет пользователям полный ход мыслей, который o1 не публикует.Подобно o1-preview от OpenAI, предварительный просмотр DeepSeek-R1-Lite рассуждал о задаче, планировал и выполнял ряд действий, чтобы помочь модели прийти к ответу, и показывал весь процесс мышления. DeepSeek-R1-Lite был обучен с помощью обучения с подкреплением, и процесс рассуждения включал в себя множество размышлений и проверок, а цепочки мыслей составляли десятки тысяч слов. Процесс рассуждения включает в себя множество размышлений и проверок, а цепочки мыслей составляют десятки тысяч слов, что делает его более эффективным. В настоящее время он поддерживает только веб-использование, а официальная версия будет полностью с открытым исходным кодом.DeepSeek-R1-Lite Preview отлично справляется с заданиями по математике, коду и сложным логическим рассуждениям, превосходя o1-preview в некоторых тестах. В таких престижных конкурсах, как AIME, самый высокий уровень сложности в американской математической олимпиаде AMC, и codeforces, лучшая в мире олимпиада по программированию, он превзошел o1-превью и другие модели.Дайте ему базовый "клубничный тест", и он ответит идеально.В зависимости от сложности вопроса DeepSeek-R1 может "думать" десятки секунд, прежде чем ответить, и пользователи сообщали о более длительном времени рассуждений по одному и тому же вопросу, чем o1. Официально считается, что чем больше длина цепочки мыслей, тем дольше время рассуждений, тем точнее результаты.В Интернете были проведены различные тесты, и оказалось, что DeepSeek также легко делает джейлбрейк - то есть выдает подсказки, игнорирующие меры безопасности. Один пользователь X заставил DeepSeek-R1-Lite дать подробный рецепт яда, написав специальные подсказки для джейлбрейка.Конечно, в онлайн-тестировании DeepSeek-R1-Lite все равно не справлялся со всеми задачами, особенно с "крестиком-ноликом" и другими логическими задачами, как и o1.Войдите на сайт chat.deepseek.com и выберите режим "Глубокое мышление" в поле ввода, чтобы пообщаться с предварительным просмотром DeepSeek-R1-Lite. Режим "Глубокое мышление" специально разработан для сложных логических вопросов по математике, коду и т. д. и дает более полные, четкие и строгие ответы, чем простые вопросы.Однако в настоящее время он поддерживает веб-использование, пока что не поддерживает вызовы API и имеет суточную квоту в 50 использований.