Учебник, который научит обычного человека правильно понимать и использовать DeepSeek-R1

Практические уроки по искусственному интеллектуОпубликовано 1 год назад Круг обмена ИИ

53.6K 00

DeepSeek-R1 Ничего особенного по сравнению с другими большими моделями, ваше удивление заключается в том, чтобы увидеть мыслительный процесс или превосходное китайское выражение. Если вы пользовались ChatGPT Чувствуете себя безвкусно, тогда сюрприз, преподнесенный DeepSeek-R1, может оказаться иллюзией. Если вы каждый день заняты детьми и доставкой, не стоит обращать внимание на DeepSeek - вы не получите от него ничего, кроме пустой траты времени.

контексты

Важная справочная информация о DeepSeek-R1, если вы не сплетничаете, можете пропустить это.DeepSeek-R1 родилась из известной компании количественных инвестиций - "Mirage Quantitative", полное название компании "Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co.", основатель Лян Вэньфэн.

DeepSeek выпустила модель вывода "DeepSeek-R1-Lite" 20 ноября 2024 года.DeepSeek-R1-Lite можно использовать с включенной функцией "Глубокое мышление" в пользовательском интерфейсе. Однако DeepSeek-R1-Lite был обучен на меньшей базовой модели и получил меньше внимания, тогда как DeepSeek-R1 был обучен на большей базовой модели, DeepSeek-V3-Base, и его общие возможности были значительно улучшены. Поэтому DeepSeek-R1-Lite - это предварительная версия DeepSeek-R1 двухмесячной давности. Необходимо срочно выпустить ее, чтобы пользователи смогли испытать...

20 января Люн Мань-фун присутствовал и выступал на важном "собрании", и в тот же день он сделал следующее заявление. Технический отчет DeepSeek-R1Интересно, какая история скрывается за этим совпадением, как за взрывом Не Чжа...

Причина раннего фейерверка DeepSeek-R1 лежала в основном в технической области, поскольку он открыл технические отчеты о том, как использовать недорогие (стоимость GPU - $5 576 000.Вот другая точка зрения) воспроизводится".o1" и его параллелизм очень высок, с меньшими аппаратными ресурсами можно запускать крупномасштабные "модели вывода". Простое объяснение - снижение цены на большие модели, чтобы каждый мог позволить себе использовать лучшие большие модели.

Во второй раз после выхода с ринга нетизены облетела волна всевозможных новостей, например, о том, что Не Чжа взорвался...

Три раза из круга является само медиа с волной горячей "деньги", так что мы видим в различных группах: 360 линия DeepSeek-R1, научить вас локально развернуть DeepSeek-R1, Университет Цинхуа, чтобы научить вас использовать DeepSeek-R1

Мы подошли к финальной стадии: DeepSeek-R1 для всех, и новости об этом должны были появиться на государственных предприятиях, центральных предприятиях и даже на улицах районов и округов.

Где использовать DeepSeek-R1

Я спрашивал многих людей, которые, возможно, даже не могут найти URL-адрес DeepSeek-R1, некоторые из них потому, что официальный сайт застрял, и ищут другие сервисы, предлагающие модель DeepSeek-R1, но то, что вы знаете, может быть совсем не так...

Каналы официального использования

Его официальный сайт: https://chat.deepseek.com/ Версии клиента для ПК не существует, APP для мобильных телефонов можно найти в крупных магазинах приложений по запросу "DeepSeek".

Другие каналы использования

Многие инструменты искусственного интеллекта в настоящее время интегрируют DeepSeek-R1, хотя их качество вывода не одинаково, мы рекомендуем только инструмент, который близок к оригиналу, чтобы избежать трудностей при выборе:

Tencent Yuanbao: https://yuanbao.tencent.com/ Мы также предоставляем APP, пожалуйста, ищите "Yuanbao" на официальном сайте и в крупных магазинах приложений для загрузки.

Не забудьте отметить следующие параметры при использовании веб-версии:

Установка DeepSeek-R1 на локальные компьютеры и мобильные телефоны

Во-первых, соответствует ли графический процессор вашего компьютера требованиямУстановка DeepSeek-R1 Минимальные требования? Если вы не имеете представления о графических процессорах, не рассматривайте вариант локальной установки.

Установка ПК DeepSeek-R1

Рекомендуем Оллама Установка, его URL: https://ollama.com/ , соответствующие модели, которые можно установить, находятся здесь: https://ollama.com/search?q=deepseek-r1 , если вам нужно подробное руководство по установке, то локальная установка и использование не рекомендуется.

Например, видеокарту 3060, на которой едва ли можно запустить модель 14B (официальная дистиллированная версия), можно установить, скопировав следующую команду:

Если конфигурация вашего компьютера "высокая" и вы хотите развернуть его локально, мы рекомендуем следующие локальные программы установки одним щелчком мыши

Локальная установка требует определенной технической базы, здесь мы предоставляем DeepSeek-R1 плюс чат-интерфейс локальный пакет установки в один клик:Избежать подводных камней руководство: Taobao DeepSeek R1 установки пакета платных upsell? Научите вас локальному развертыванию бесплатно (с установщиком в один клик)

Если у вас "низкая" конфигурация компьютеров и вы хотите развернуть систему локально, мы рекомендуем следующие варианты развертывания в облаке

Частное развертывание без локальных графических процессоров DeepSeek-R1 32B

Установка DeepSeek-R1 на мобильные телефоны

Определите фокус!Когда вы устанавливаете DeepSeek-R1 на свой мобильный телефон, вы хотите загрузить официальное приложение или запустить модель DeepSeek-R1 локально на своем мобильном телефоне? Если вы просто хотите использовать его на своем мобильном телефоне и не хотите запускать его локально на своем мобильном телефоне, вы можете загрузить его, найдя "DeepSeek" или "Tencent Yuanbao" в магазине приложений, оба из которых доступны онлайн. Ниже приведен только способ локального запуска модели DeepSeek-R1 на вашем мобильном телефоне.

Недостатки локальной установки DeepSeek-R1 в мобильном телефоне:Установленная модель имеет ограниченные возможности по грамотному написанию простых текстов, сбору и обобщению информации.

Если вы решите установить:Локальная установка на мобильный телефон Описание модели DeepSeek-R1 для моделей IOS и Android Premium

Для чего нужен DeepSeek-R1

DeepSeek-R1 очень хорош и может многое сделать, начать с устранения, понять Для чего не подходит DeepSeek-R1. Я сгенерировал около 5000 вопросов для DeepSeek-R1 (полнокровная версия) и получил некоторый опыт для ознакомления:

1. Неправильный вопрос вызывает галлюцинации Ответ: R1Галлюцинации хуже, чем в ChatGPT. И обычному человеку сложно задать R1 вопросы, которые будут правильно "заданы", поэтому ответы, которые вы получаете, часто бывают галлюцинаторными.

2. не подходит для исследовательских задач, связанных с вопросами хронологииПроблема кроется в трех местах: (1) знания, подготовленные большой моделью, запаздывают, (2) даже в сетевом режиме "глубокое мышление" ограничено количеством вспоминаемой информации, поскольку это однократное вспоминание сетевой информации и не может собрать полную информацию о временной проблеме, и (3) мышлению мешает слишком много контекста, см. 3).

3. Глубокое мышление легко отвлекается на контекстТа же проблема - включение веб-поиска приводит к получению худших результатов, потому что он вводит много информации из Сети и запутывает мыслительный процесс. Это серьезная проблема.

4.Как "глубокое мышление" может помешать четкой инструкции по постановке вопросов.: Мышление игнорирует "главную директиву" в пользу других контекстов, что приводит к постепенному рассеиванию мыслей и чрезмерному времени ожидания.

Давайте посмотрим на то, как очень простая инструкция по выполнению задания с небольшим контекстом может быть искажена "мышлением", на примере DeepSeek слева и ChatGPT справа.

5. если вы просто ищете информацию, Google и Baidu могут дать лучшие результаты.Если вы хотите получить больше информации из результатов поиска, эффективнее использовать поисковую систему. Особенно когда объем информации велик.R1 не поможет вам проанализировать большое количество веб-страниц с информацией, потому что его помощь заключается в поиске ограниченного объема информации, запоминании ограниченного объема информации, тем более способность судить о результатах поиска правильно или неправильно еще более ограничена, будет куча голов из кучи результатов поиска, чтобы помочь вам рассуждать, а затем дать вам ответ.

Сложные сценарии, такие как написание статьи, сбор информации о "данных", организация, необходимость нескольких раундов сбора информации, нескольких раундов рассуждений (ручное управление также имеет ту же логику), R1 - это только раунд сбора информации и рассуждений, он не может решить сложные систематические задачи сразу. Когда вы это знаете, можно попытаться вручную собрать необходимую информацию, обобщить ее, а затем передать в R1 для анализа.

Правильное использование DeepSeek-R1

Внимание:Даже если вы не используете модель DeepSeek-R1, когда вы используете другие модели, добавьте перед вопросом предложение "Давайте думать шаг за шагом", и другие модели все равно дадут вам подробный ход мыслей. Однако уровень детализации рассуждений и окончательный ответ могут быть не такими хорошими, как в DeepSeek-R1.

На самом деле, техника использования DeepSeek-R1 не сильно отличается от других моделей, нужно лишь помнить о некоторых деталях.

1. если вас не устраивает сложность вопроса или ответ, который вы получаете после включения поиска, попробуйте отключить "Глубокое мышление". После его отключения я использовал модель V3, которая по-прежнему очень хороша.

2. Используйте простые инструкции, а Deep Think поможет вам думать!

Правильно:Переведите для меня.

Ошибка:Помогите мне перевести на китайский, используйте для перевода слова, соответствующие привычкам китайских пользователей, важные термины должны быть сохранены на языке оригинала, при переводе следует обратить внимание на верстку.

Больше примеров ошибок:
1. у меня есть очень важный отчет об исследовании рынка, содержащий много информации. я надеюсь, что вы внимательно и вдумчиво его прочитаете, глубоко обдумаете и проанализируете. какие наиболее важные тенденции рынка представлены в этом отчете? Лучше всего перечислить три наиболее важные тенденции и объяснить, почему вы считаете их самыми важными.
2. Вот несколько примеров диагностики заболеваний: [Пример 1], [Пример 2] Теперь, пожалуйста, диагностируйте заболевание, которым может страдать пациент, на основании следующей информации из истории болезни. [Вставить информацию из истории болезни].

3. используйте сложные команды для активизации "глубокого мышления" (не рекомендуется создавать сложные команды без определенного опыта, так как сложные команды и слишком большой контекст могут запутать модель R1).

Правильно:Помогите мне перевести на китайский, используйте для перевода слова, соответствующие привычкам китайских пользователей, важные термины должны быть сохранены на языке оригинала, при переводе следует обратить внимание на верстку.

Ошибка:Переведите для меня.

Примечание: Чтобы диалектически рассмотреть конфликты, вытекающие из 2 и 3, начните с простых команд, и если ответ не удовлетворяет определенному требованию, то увеличьте условия команды соответствующим образом.

Проверьте себя, прочитав следующий текст

**# How does better chunking lead to high-quality responses?
**If you’re reading this, I can assume you know what chunking and RAG are. Nonetheless, here is what it is, in short.**
**LLMs are trained on massive public datasets. Yet, they aren’t updated afterward. Therefore, LLMs don’t know anything after the pretraining cutoff date. Also, your use of LLM can be about your organization’s private data, which the LLM had no way of knowing.**
**Therefore, a beautiful solution called RAG has emerged. RAG asks the LLM to ** answer questions based on the context provided in the prompt itself** . We even ask it not to answer even if the LLM knows the answer, but the provided context is insufficient.**
**How do we get the context? You can query your database and the Internet, skim several pages of a PDF report, or do anything else.**
**But there are two problems in RAGs.**
* **LLM’s **context windows sizes** are limited (Not anymore — I’ll get to this soon!)**
* **A large context window has a high ** signal-to-noise ratio** .**
**First, early LLMs had limited window sizes. GPT 2, for instance, had only a 1024 token context window. GPT 3 came up with a 2048 token window. These are merely the **size of a typical blog post** .**
**Due to these limitations, the LLM prompt cannot include an organization’s entire knowledge base. Engineers were forced to reduce the size of their input to the LLM to get a good response.**
**However, various models with a context window of 128k tokens showed up. This is usually **the size of an annual report** for many listed companies. It is good enough to upload a document to a chatbot and ask questions.**
**But, it didn’t always perform as expected. That’s because of the noise in the context. A large document easily contains many unrelated information and the necessary pieces. This unrelated information drives the LLM to lose its objective or hallucinate.**
**This is why we chunk the documents. Instead of sending a large document to the LLM, we break it into smaller pieces and only send the most relevant pieces.**
**However, this is easier said than done.**
**There are a million possible ways to break a document into chunks. For instance, you may break the document paragraph by paragraph, and I may do it sentence by sentence. Both are valid methods, but one may work better than the other in specific circumstances.**
**However, we won’t discuss sentence and paragraph breaks, as they are trivial and have little use in chunking. Instead, we will discuss slightly more complex ones that break documents for RAGs.**
**In the rest of the post, I’ll discuss a few chunking strategies I’ve learned and applied.********

4. фреймы слов-подсказок остаются аффективными

Для того чтобы взять в привычку вводить хорошие слова подсказки, требуется всего четыре условия: [персонаж] [действие, которое должна выполнить большая модель] [цель миссии] [контекст миссии] (контекст миссии необязателен)

Пример:Играйте роль эксперта в официальном письме.Помогите мне написать доклад о моем выступлении на конференции "Сотрудник года". Речь должна длиться около 5 минут и быть искренней и скромной.Моя компания называется PetroChina, моего руководителя зовут Ли Фугуй, я работаю в сфере разведки нефти, и я получил награду, потому что сотрудники проголосовали за меня вторым.

5. научитесь позволять большим моделям помогать вам задавать вопросы, ведь хорошие вопросы приводят к хорошим ответам

Возвращаясь к пункту "4", приведенным примерам подсказок, видите ли вы какие-либо проблемы?

Описания недостаточно подробны, чтобы написать отчет, который нельзя использовать напрямую, а трудность, с которой сталкивается большинство людей при работе с большими моделями, заключается в том, что они не могут задавать вопросы или не хотят утруждать свой мозг вопросами.

Проблема на самом деле довольно проста: прежде чем создавать идеальный вопрос, научитесь задавать большие модели, которые помогут вам отточить свою постановку вопроса.

6. задавать вопросы, чтобы их направляли, или делать процесс мышления R1 направленным - это очень старый метод, который применим не только к R1

Следующие методы обычно не обязательно должны использоваться в модели вывода, такой как R1, но это зависит от конкретной задачи, и если ваша проблема очень направленная, вы можете включить некоторые из них.Описывайте логически простые, короткие контексты.

Prompt_ID	Тип	Триггерный приговор	Китайский
101	CoT	Давайте думать шаг за шагом.	Мы думаем шаг за шагом.
201	PS	Давайте сначала разберемся в проблеме и разработаем план ее решения, а затем шаг за шагом выполним план решения проблемы.	Сначала давайте поймем суть проблемы и составим план ее решения. Затем давайте решать проблему шаг за шагом в соответствии с планом.
301	PS+	Сначала разберемся в проблеме, выделим соответствующие переменные и соответствующие им числительные и составим план. Затем выполним план, вычислим промежуточные переменные (обратите внимание на правильное исчисление числительных и на логику), решим задачу шаг за шагом и покажем ответ. Затем выполним план, вычислим промежуточные переменные (обратите внимание на правильное вычисление числительных и на логику), решим задачу шаг за шагом и покажем ответ.	Сначала разберемся с проблемой, выделим соответствующие переменные и их значения, а затем составим план. Затем выполним план, вычислим промежуточные переменные (обращая внимание на правильное вычисление чисел и здравый смысл), пошагово решим задачу и выведем ответ.
302	PS+	Сначала разберемся в проблеме, выделим соответствующие переменные и соответствующие им числительные и составим полный план. Затем выполним план, вычислим промежуточные переменные (обращайте внимание на правильность числовых вычислений и на логику), решим проблему шаг за шагом и покажем Затем выполним план, вычислим промежуточные переменные (обратите внимание на правильность числовых вычислений и на логику), решим задачу шаг за шагом и покажем ответ.	Сначала разберемся с проблемой, выделим соответствующие переменные и их значения и составим полный план. Затем выполним план, вычислим промежуточные переменные (обращая внимание на правильность численных расчетов и здравый смысл), шаг за шагом решим задачу и выведем ответ.
303	PS+	Давайте разработаем план и будем решать проблему шаг за шагом.	Давайте составим план и будем решать проблему шаг за шагом.
304	PS+	Сначала разберемся в проблеме и разработаем полный план. Затем шаг за шагом выполним план и разберем проблему. На каждом шаге отвечайте на подвопрос: "Подбрасывает ли человек монету и каково ее текущее состояние?". В соответствии с последним состоянием монеты дайте окончательный ответ (обращайте внимание на каждое подбрасывание и поворотное состояние монеты).	Сначала разберитесь в проблеме и разработайте полный план. Затем выполним план и шаг за шагом решим проблему. Каждый шаг отвечает на подвопросы: "Бросает ли человек монету и каково ее текущее состояние?" . Дайте окончательный ответ, исходя из конечного состояния монеты (отмечайте каждое подбрасывание и состояние монеты).
305	PS+	Сначала разберемся в проблеме, выделим соответствующие переменные и соответствующие им числительные и составим полный план. Затем выполним план, вычислим промежуточные переменные (обратите внимание на правильность числовых вычислений и на логику), решим проблему шаг за шагом и покажем Затем выполним план, вычислим промежуточные переменные (обратите внимание на правильность числовых вычислений и логику), решим задачу шаг за шагом и покажем ответ.	Сначала разберемся с проблемой, выделим соответствующие переменные и их значения и составим полный план. Затем выполним план, вычислим промежуточные переменные (обращая внимание на правильность численных расчетов и здравый смысл), шаг за шагом решим задачу и выведем ответ.
306	PS+	Сначала подготовим необходимую информацию и составим план. Затем шаг за шагом ответим на вопрос (обратите внимание на бессмыслицу и логическую связность). Затем давайте ответим на вопрос шаг за шагом (обратите внимание на бессмыслицу и логическую последовательность).	Сначала подготовьте необходимую информацию и составьте план. Затем шаг за шагом ответьте на вопросы (обращая внимание на здравый смысл и логическую последовательность).
307	PS+	Сначала разберемся в проблеме, выделим соответствующие переменные и соответствующие им числительные, составим и разработаем полный план. Затем выполним план, вычислим промежуточные переменные (обращайте внимание на правильность числовых вычислений и на логику), решим проблему шаг за шагом и Затем выполним план, вычислим промежуточные переменные (обращайте внимание на правильность числовых вычислений и на логику), решим задачу шаг за шагом и покажем ответ.	Сначала разберемся с проблемой, выделим соответствующие переменные и их значения и составим полный план. Затем выполним план, вычислим промежуточные переменные (обращая внимание на правильность численных расчетов и здравый смысл), шаг за шагом решим задачу и выведем ответ.

7. дезамбигация вопросов

Важно активно исключать возможные двусмысленности в вопросах, основанных на опыте, поскольку большие модели рассуждений готовы помочь вам "предположить" вопросы, как в упомянутом ранее примере, где неправильный вопрос приводит к неправильному предположению и неправильному ответу.

8. выбирайте между длиной ввода и глубиной рассуждений.

Слишком длинные вводы тормозят рассуждения и рассеивают проблемы, а короткие вводы укрепляют рассуждения и сохраняют концентрацию внимания, что является взаимоисключающим фактором.

9. управление форматом выходного контента

Обратитесь к разделу "4", где описаны рамки слов-подсказок. В последнем разделе можно добавить [Output Format], чтобы ограничить формат выходного содержимого большой модели.

Существует два типа форматов выходного контента управления:

1. Типография

Пример 1: Вывод с использованием форматирования и компоновки содержимого в формате markdown

Пример 2: Выходная статья разрешена для вставки в word для использования

2.Шаблон

Пример 1: Создайте статью, состоящую из трех разделов: введение, объяснение и резюме.

Пример 2:подсказка: резюме групповых чатов, записи встреч, такие многораундовые беседы

Расширенное чтение на DeepSeek-R1

DeepSeek-R1 WebGPU: запустите DeepSeek R1 1.5B локально в вашем браузере!

Tifa-DeepsexV2-7b-MGRPO: модель, поддерживающая ролевые игры и сложные диалоги, с производительностью выше 32b (с пакетом установки в один клик)

Реализация локальной/API-базы знаний на основе DeepSeek-R1 и доступ к WeChat BOT

DeepSeek Official Pick: Руководство по практическим инструментам искусственного интеллекта с интеграцией DeepSeek R1

Джейлбрейк DeepSeek R1: попытка прорваться через цензуру DeepSeek

Обучите собственную модель вывода DeepSeek R1 с помощью Unsloth

Практические уроки по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Руководство по настройке шлюза ИИ Cloudflare: централизация служб вызовов API ИИ

Практические уроки по искусственному интеллекту

1 год назад

083.2K

Предотвращение плагиата в искусственном интеллекте: стратегии и практики предотвращения от инструктивного дизайна в дальнейшем

Практические уроки по искусственному интеллекту

1 год назад

056.7K

Руководство по Trae IDE: простая настройка пользовательских правил искусственного интеллекта (Trae Rules)

Практические уроки по искусственному интеллекту

10 месяцев назад

0220.8K

Dify Workflow: попрощайтесь с громоздкой стыковкой API, генерируйте код и параметры запроса одним щелчком мыши

Практические уроки по искусственному интеллекту

1 год назад

069.1K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Учебник, который научит обычного человека правильно понимать и использовать DeepSeek-R1

контексты

Где использовать DeepSeek-R1

Установка DeepSeek-R1 на локальные компьютеры и мобильные телефоны

Установка ПК DeepSeek-R1

Установка DeepSeek-R1 на мобильные телефоны

Для чего нужен DeepSeek-R1

Правильное использование DeepSeek-R1

Расширенное чтение на DeepSeek-R1

Руководство по началу работы с Bit Flows: учебник для начинающих

Эффективный инструмент для создания заметок с искусственным интеллектом: NoteGen поможет вам раскрыть творческий потенциал, эффективно фиксируя вдохновение

Похожие статьи

Руководство по настройке шлюза ИИ Cloudflare: централизация служб вызовов API ИИ

Предотвращение плагиата в искусственном интеллекте: стратегии и практики предотвращения от инструктивного дизайна в дальнейшем

Руководство по Trae IDE: простая настройка пользовательских правил искусственного интеллекта (Trae Rules)

Dify Workflow: попрощайтесь с громоздкой стыковкой API, генерируйте код и параметры запроса одним щелчком мыши

Нет комментариев

Последние коллекции

Последние статьи

Учебник, который научит обычного человека правильно понимать и использовать DeepSeek-R1

контексты

Где использовать DeepSeek-R1

Установка DeepSeek-R1 на локальные компьютеры и мобильные телефоны

Установка ПК DeepSeek-R1

Установка DeepSeek-R1 на мобильные телефоны

Для чего нужен DeepSeek-R1

Правильное использование DeepSeek-R1

Расширенное чтение на DeepSeek-R1

Руководство по началу работы с Bit Flows: учебник для начинающих

Эффективный инструмент для создания заметок с искусственным интеллектом: NoteGen поможет вам раскрыть творческий потенциал, эффективно фиксируя вдохновение

Похожие статьи

Руководство по настройке шлюза ИИ Cloudflare: централизация служб вызовов API ИИ

Предотвращение плагиата в искусственном интеллекте: стратегии и практики предотвращения от инструктивного дизайна в дальнейшем

Руководство по Trae IDE: простая настройка пользовательских правил искусственного интеллекта (Trae Rules)

Dify Workflow: попрощайтесь с громоздкой стыковкой API, генерируйте код и параметры запроса одним щелчком мыши

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи