Un tutoriel pour apprendre au commun des mortels à comprendre et à utiliser correctement DeepSeek-R1

Tutoriels pratiques sur l'IAPosté il y a 7 mois Cercle de partage de l'IA

16.8K 00

Profondeur de l'eau-R1 Rien de spécial par rapport à d'autres grands modèles, votre surprise est de voir le processus de réflexion ou l'excellente expression chinoise. Si vous avez utilisé ChatGPT Si vous vous sentez insipide, la surprise apportée par DeepSeek-R1 n'est peut-être qu'une illusion. Si vous êtes occupé par les enfants et les livraisons quotidiennes, il est inutile de prêter attention à DeepSeek, vous n'en tirerez rien d'autre qu'une perte de temps.

contextes

Informations générales importantes sur DeepSeek-R1, si vous ne connaissez pas les potins, vous pouvez les ignorer.DeepSeek-R1 est née d'une société d'investissement quantitatif bien connue - "Mirage Quantitative", dont le nom complet est "Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co.", fondateur Liang Wenfeng.

DeepSeek a publié le modèle d'inférence "DeepSeek-R1-Lite" le 20 novembre 2024.DeepSeek-R1-Lite peut être utilisé avec la fonction "Deep Thinking" activée dans l'interface utilisateur. Cependant, DeepSeek-R1-Lite a été entraîné avec un modèle de base plus petit et a reçu moins d'attention, alors que DeepSeek-R1 a été entraîné avec un modèle de base plus grand, DeepSeek-V3-Base, et ses capacités globales ont été grandement améliorées. Par conséquent, DeepSeek-R1-Lite est la version préliminaire de DeepSeek-R1 d'il y a 2 mois. Il est urgent de la publier pour que les utilisateurs puissent en faire l'expérience...

Le 20 janvier, Leung Man-fung a assisté et pris la parole lors d'une importante "réunion" et, le même jour, il a publié la déclaration suivante. Rapport technique DeepSeek-R1Je me demande ce qui se cache derrière cette coïncidence, comme l'explosion de Ne Zha...

La raison des premiers feux d'artifice de DeepSeek-R1 se situe principalement dans le domaine technique, puisqu'il a ouvert des rapports techniques sur la manière d'utiliser les GPU à faible coût (5 576 000 dollars, le coût du GPU de laVoici un autre point de vue) reproduit".o1"et sa simultanéité est très élevée, avec moins de ressources matérielles, il est possible d'exécuter un "modèle d'inférence" à grande échelle. Une explication simple est de faire baisser le prix des grands modèles, afin que tout le monde puisse se permettre d'utiliser de meilleurs grands modèles.

La deuxième fois qu'ils sortent du ring, les internautes sont bombardés de nouvelles de toutes sortes, comme Ne Zha qui s'enflamme...

Trois fois hors du cercle est l'auto-média avec la vague de "l'argent" chaud, donc nous voyons dans une variété de groupes : 360 ligne DeepSeek-R1, vous apprendre à déployer localement DeepSeek-R1, l'Université Tsinghua pour vous apprendre à utiliser le DeepSeek-R1.

Nous en sommes maintenant à l'étape finale : DeepSeek-R1 pour tous, et nous devrions avoir reçu des nouvelles à ce sujet dans les entreprises publiques, les entreprises centrales, et même dans les rues des districts et des comtés.

Où utiliser DeepSeek-R1

J'ai demandé à beaucoup de gens qui ne peuvent même pas trouver l'URL de DeepSeek-R1, certains parce que le site officiel est bloqué et cherchent d'autres services qui offrent le modèle DeepSeek-R1, mais ce que vous savez est peut-être tout à fait faux...

Canaux d'utilisation officiels

Son site officiel est le suivant : https://chat.deepseek.com/ Il n'existe pas de version client pour PC, l'APP pour téléphone portable doit être recherchée dans les principales boutiques d'applications sous le nom de "DeepSeek".

Autres canaux d'utilisation

De nombreux outils d'IA intègrent actuellement DeepSeek-R1, bien que leur qualité de sortie ne soit pas la même, nous recommandons uniquement un outil qui est proche de l'original afin d'éviter les difficultés de choix :

Tencent Yuanbao : https://yuanbao.tencent.com/ Nous fournissons également l'APP, veuillez rechercher "Yuanbao" sur le site officiel et dans les principales boutiques d'applications pour le télécharger.

N'oubliez pas de cocher les options suivantes lorsque vous utilisez la version web :

Installation de DeepSeek-R1 sur les ordinateurs locaux et les téléphones portables

Tout d'abord, le GPU de votre ordinateur répond-il à la normeInstallation de DeepSeek-R1 Exigences minimales? Si vous n'avez aucune idée des GPU, n'envisagez pas une installation locale.

Installation sur PC DeepSeek-R1

Recommandé Ollama Installation, son URL est : https://ollama.com/ , les modèles pertinents qui peuvent être installés sont ici : https://ollama.com/search?q=deepseek-r1 , si vous avez besoin d'un tutoriel détaillé pour l'installation, l'installation locale n'est pas recommandée.

Par exemple, une carte graphique 3060, qui peut à peine faire fonctionner le modèle 14B (version officielle distillée), peut être installée en copiant la commande suivante :

Si la configuration de votre ordinateur est "élevée" et que vous souhaitez procéder à un déploiement local, nous vous recommandons les installateurs locaux en un clic suivants

L'installation locale nécessite une certaine base technique, ici nous fournissons DeepSeek-R1 plus l'interface de chat, un paquet d'installation locale en un clic :Guide pour éviter les pièges : Taobao DeepSeek R1 installation package paid upsell ? Apprenez le déploiement local gratuitement (avec l'installateur en un clic)

Si vous avez une configuration informatique "faible" et que vous souhaitez effectuer un déploiement local, nous vous recommandons les options de déploiement en nuage suivantes

Déploiement privé sans GPU locaux DeepSeek-R1 32B

Installation de DeepSeek-R1 sur les téléphones portables

Délimiter l'objectif !Lorsque vous installez DeepSeek-R1 sur votre téléphone portable, votre but est-il de télécharger l'application officielle ou d'exécuter le modèle DeepSeek-R1 localement sur votre téléphone portable ? Si vous souhaitez simplement l'utiliser sur votre téléphone portable, et que vous ne voulez pas l'exécuter localement sur votre téléphone portable, vous pouvez la télécharger en recherchant "DeepSeek" ou "Tencent Yuanbao" dans la boutique d'applications, qui sont toutes deux disponibles en ligne. Ce qui suit n'est qu'une méthode pour exécuter le modèle DeepSeek-R1 localement sur votre téléphone portable.

Inconvénients de l'installation locale de DeepSeek-R1 sur votre téléphone portable :Le modèle installé a une capacité limitée à rédiger intelligemment des textes simples, à rassembler et à résumer des informations.

Si vous décidez d'installer :Installation locale des modèles DeepSeek-R1 sur les téléphones portables, pour les modèles IOS et Android Premium

A quoi sert DeepSeek-R1 ?

DeepSeek-R1 est très bon et peut faire beaucoup de choses, commencer par éliminer, comprendre Ce que DeepSeek-R1 ne fait pas. J'ai généré environ 5000 questions pour DeepSeek-R1 (version complète) et j'ai acquis de l'expérience pour votre référence :

1) Une mauvaise question crée une hallucination Réponse : R1Les hallucinations sont pires que le ChatGPT. Et il est intrinsèquement difficile pour une personne moyenne de poser des questions R1 qui seront correctement "posées", de sorte que les réponses que vous obtenez sont souvent hallucinatoires.

2. inadaptée aux tâches de recherche liées aux questions de calendrierLe problème se situe à trois endroits : (1) les connaissances formées par le grand modèle ont un décalage, (2) même en mode réseau, la "pensée profonde" est limitée par le nombre d'informations rappelées parce qu'il s'agit d'un rappel unique des informations du réseau et qu'elle ne peut pas collecter des informations complètes sur le problème temporel, et (3) la pensée est perturbée par un contexte trop important, voir 3).

3. la pensée profonde est facilement détournée par le contexteMême problème, l'activation de la recherche sur le web conduit à des résultats moins bons parce qu'elle introduit beaucoup d'informations provenant du web et brouille le processus de réflexion. Il s'agit d'un problème grave.

4.Comment un questionnement clair peut être perturbé par une "pensée profonde".La pensée ignore la "directive première" au profit d'autres contextes, ce qui entraîne une dispersion progressive de la pensée et un temps d'attente excessif pour la pensée.

Voyons comment une instruction de tâche très simple, avec très peu de contexte, peut être corrompue par la "pensée", avec DeepSeek à gauche et ChatGPT à droite.

5) Si vous recherchez simplement des informations, Google et Baidu peuvent donner de meilleurs résultats.Si vous souhaitez obtenir davantage d'informations à partir des résultats de la recherche, il est plus efficace d'utiliser un moteur de recherche. R1 ne vous aidera pas à analyser un grand nombre de pages web d'informations, parce qu'il vous aide à rechercher une quantité limitée d'informations, peut se souvenir d'une quantité limitée d'informations, en particulier la capacité de juger les résultats de la recherche du bon ou du mauvais encore plus limitée, sera un tas de tête d'un tas de résultats de recherche pour vous aider à raisonner, et ensuite vous donner la réponse.

Les scénarios complexes, tels que la rédaction d'un article, la collecte d'informations sur les "données", l'organisation, la nécessité de plusieurs cycles de collecte d'informations, de plusieurs cycles de raisonnement (l'opération manuelle relève également de la même logique), R1 n'est qu'un cycle de collecte d'informations et de raisonnement, il ne peut pas résoudre les problèmes systématiques complexes en une seule fois. Lorsque vous savez cela, vous pouvez essayer de rassembler manuellement les informations pertinentes, de les résumer, puis de les transmettre à R1 pour analyse.

Utiliser correctement DeepSeek-R1

Attention :Même si vous n'utilisez pas le modèle DeepSeek-R1, lorsque vous utilisez d'autres modèles, ajoutez une phrase "Réfléchissons étape par étape" avant la question, et les autres modèles vous donneront toujours un processus de réflexion détaillé. Cependant, le niveau de détail du raisonnement et la réponse finale peuvent ne pas être aussi bons que ceux de DeepSeek-R1.

En fait, les techniques d'utilisation de DeepSeek-R1 ne sont pas très différentes des autres modèles, à quelques détails près.

1) Si vous n'êtes pas satisfait de la complexité de la question ou de la réponse que vous obtenez après avoir activé la recherche, essayez de désactiver la fonction "Réflexion approfondie". Après l'avoir désactivé, j'ai utilisé le modèle V3, qui est toujours très bon.

2) Utilisez des instructions simples et Deep Think vous aidera à réfléchir !

Correct :Traduisez-moi.

Erreur :Aidez-moi à traduire en chinois, utilisez des mots qui correspondent aux habitudes des utilisateurs chinois pour traduire, les termes importants doivent être conservés dans la langue originale, la traduction doit faire attention à la mise en page.

Autres exemples d'erreurs :
1) J'ai ici un rapport d'étude de marché très important, avec beaucoup de contenu et d'informations. J'espère que vous le lirez attentivement, que vous y réfléchirez profondément et que vous l'analyserez. Quelles sont les tendances du marché les plus importantes dans ce rapport ? Il serait préférable d'énumérer les trois tendances les plus importantes et d'expliquer pourquoi vous pensez qu'elles sont les plus importantes.
2) Voici quelques exemples de diagnostic de maladie : [Exemple 1], [Exemple 2] Maintenant, veuillez diagnostiquer la maladie dont souffre le patient en vous basant sur les informations suivantes du dossier médical. [Coller les informations sur les antécédents médicaux].

3. utiliser des commandes complexes pour activer la "pensée profonde" (il n'est pas recommandé de construire des commandes complexes sans une certaine expérience, car des commandes complexes et un contexte trop important peuvent perturber le modèle R1).

Correct :Aidez-moi à traduire en chinois, utilisez des mots qui correspondent aux habitudes des utilisateurs chinois pour traduire, les termes importants doivent être conservés dans la langue originale, la traduction doit faire attention à la mise en page.

Erreur :Traduisez-moi.

Note : Pour examiner les conflits découlant des points 2 et 3 d'une manière dialectique, commencez par essayer des ordres simples et, lorsque la réponse ne satisfait pas à une exigence particulière, augmentez les conditions de l'ordre de manière appropriée.

Testez vous avec le texte suivant

**# How does better chunking lead to high-quality responses?
**If you’re reading this, I can assume you know what chunking and RAG are. Nonetheless, here is what it is, in short.**
**LLMs are trained on massive public datasets. Yet, they aren’t updated afterward. Therefore, LLMs don’t know anything after the pretraining cutoff date. Also, your use of LLM can be about your organization’s private data, which the LLM had no way of knowing.**
**Therefore, a beautiful solution called RAG has emerged. RAG asks the LLM to ** answer questions based on the context provided in the prompt itself** . We even ask it not to answer even if the LLM knows the answer, but the provided context is insufficient.**
**How do we get the context? You can query your database and the Internet, skim several pages of a PDF report, or do anything else.**
**But there are two problems in RAGs.**
* **LLM’s **context windows sizes** are limited (Not anymore — I’ll get to this soon!)**
* **A large context window has a high ** signal-to-noise ratio** .**
**First, early LLMs had limited window sizes. GPT 2, for instance, had only a 1024 token context window. GPT 3 came up with a 2048 token window. These are merely the **size of a typical blog post** .**
**Due to these limitations, the LLM prompt cannot include an organization’s entire knowledge base. Engineers were forced to reduce the size of their input to the LLM to get a good response.**
**However, various models with a context window of 128k tokens showed up. This is usually **the size of an annual report** for many listed companies. It is good enough to upload a document to a chatbot and ask questions.**
**But, it didn’t always perform as expected. That’s because of the noise in the context. A large document easily contains many unrelated information and the necessary pieces. This unrelated information drives the LLM to lose its objective or hallucinate.**
**This is why we chunk the documents. Instead of sending a large document to the LLM, we break it into smaller pieces and only send the most relevant pieces.**
**However, this is easier said than done.**
**There are a million possible ways to break a document into chunks. For instance, you may break the document paragraph by paragraph, and I may do it sentence by sentence. Both are valid methods, but one may work better than the other in specific circumstances.**
**However, we won’t discuss sentence and paragraph breaks, as they are trivial and have little use in chunking. Instead, we will discuss slightly more complex ones that break documents for RAGs.**
**In the rest of the post, I’ll discuss a few chunking strategies I’ve learned and applied.********

4. les mots-repères restent ineffectifs

Pour prendre l'habitude de saisir de bons mots indicateurs, il suffit de remplir les quatre conditions suivantes : [personnage] [action à effectuer par le grand modèle] [objectif de la mission] [contexte de la mission] (le contexte de la mission n'est pas nécessaire).

Exemple :Jouer le rôle d'un expert en rédaction officielle.Aidez-moi à rédiger un rapport sur mon discours lors de la "Conférence de l'employé de l'année". Le discours doit durer environ 5 minutes et doit être sincère et modeste.Mon entreprise s'appelle PetroChina, mon superviseur s'appelle Li Fugui, je travaille dans l'exploration pétrolière et j'ai gagné le prix parce que j'ai été élu deuxième par les employés.

5. apprendre à laisser les grands modèles vous aider à poser des questions ; de bonnes questions conduisent à de bonnes réponses

Si l'on se réfère au point "4", les exemples d'incitations donnés, voyez-vous des problèmes ?

Les descriptions ne sont pas suffisamment détaillées pour rédiger un rapport qui ne peut pas être utilisé directement, et la difficulté que la plupart des gens rencontrent avec les grands modèles est qu'ils ne peuvent pas poser de questions ou qu'ils ne veulent pas se donner la peine d'ajouter des questions à leur cerveau.

Le problème est en fait assez simple. Avant de construire une question parfaite, apprenez à poser le grand modèle pour vous aider à affiner votre questionnement.

6. poser des questions pour qu'elles soient dirigées, ou faire en sorte que le processus de réflexion de la R1 soit dirigé, est une méthode très ancienne qui ne s'applique pas seulement à la R1

Les méthodes suivantes n'ont normalement pas besoin d'être utilisées dans un modèle d'inférence tel que R1 pour être utilisées, mais c'est un problème spécifique, et si votre problème est très orienté, vous pouvez inclure certaines des méthodes suivantes dans votre modèle d'inférence.Décrire des contextes logiquement simples et courts.

Prompt_ID	Type	Phrase de déclenchement	Chinois
101	CoT	Réfléchissons étape par étape.	Nous réfléchissons étape par étape.
201	PS	Comprenons d'abord le problème et élaborons un plan pour le résoudre. Ensuite, mettons en œuvre le plan pour résoudre le problème étape par étape.	Tout d'abord, il faut comprendre le problème et élaborer un plan pour le résoudre. Ensuite, résolvons le problème étape par étape, conformément au plan.
301	PS+	Comprenons d'abord le problème, extrayons les variables pertinentes et les chiffres correspondants et élaborons un plan. Ensuite, exécutons le plan, calculons les variables intermédiaires (attention au calcul correct des chiffres et au bon sens), résolvons le problème pas à pas et montrons la réponse. Ensuite, réalisons le plan, calculons les variables intermédiaires (attention au calcul correct des nombres et au bon sens), résolvons le problème pas à pas et montrons la réponse.	Tout d'abord, il faut comprendre le problème, extraire les variables pertinentes et leurs valeurs correspondantes, puis créer un plan. Ensuite, exécutons le plan, calculons les variables intermédiaires (en faisant attention à bien calculer les chiffres et à faire preuve de bon sens), résolvons le problème étape par étape et affichons la réponse.
302	PS+	Comprenons d'abord le problème, extrayons les variables pertinentes et les chiffres correspondants, et élaborons un plan complet. Ensuite, exécutons le plan, calculons les variables intermédiaires (attention au calcul numérique correct et au bon sens), résolvons le problème étape par étape, et montrons les résultats de l'analyse. Ensuite, réalisons le plan, calculons les variables intermédiaires (attention au calcul numérique correct et au bon sens), résolvons le problème pas à pas et montrons la la réponse.	Tout d'abord, il faut comprendre le problème, extraire les variables pertinentes et leurs valeurs correspondantes, et créer un plan complet. Ensuite, exécutons le plan, calculons les variables intermédiaires (en faisant attention aux calculs numériques corrects et au bon sens), résolvons le problème étape par étape et affichons la réponse.
303	PS+	Élaborons un plan et résolvons le problème étape par étape.	Élaborons un plan et résolvons le problème étape par étape.
304	PS+	Comprenons d'abord le problème et élaborons un plan complet. Ensuite, exécutons le plan et raisonnons le problème étape par étape. À chaque étape, répondez à la sous-question suivante : "La personne joue-t-elle à pile ou face et quel est l'état actuel de la pièce ? En fonction du dernier état de la pièce, donnez la réponse finale (faites attention à chaque pile et à l'état de rotation de la pièce).	Il faut d'abord comprendre le problème et élaborer un plan complet. Ensuite, exécutons le plan et résolvons le problème étape par étape. Chaque étape répond aux sous-questions suivantes : "La personne joue-t-elle à pile ou face et quel est l'état actuel de la pièce ?" . Donnez la réponse finale en fonction de l'état final de la pièce (notez chaque pile et l'état de la pile).
305	PS+	Comprenons d'abord le problème, extrayons les variables pertinentes et les chiffres correspondants et établissons un plan complet. Ensuite, exécutons le plan, calculons les variables intermédiaires (attention au calcul numérique correct et au bon sens), résolvons le problème étape par étape et montrons le résultat de l'exercice. Ensuite, réalisons le plan, calculons les variables intermédiaires (attention au calcul numérique correct et au bon sens), résolvons le problème pas à pas et montrons la la réponse.	Tout d'abord, il faut comprendre le problème, extraire les variables pertinentes et leurs valeurs correspondantes, et créer un plan complet. Ensuite, exécutons le plan, calculons les variables intermédiaires (en faisant attention aux calculs numériques corrects et au bon sens), résolvons le problème étape par étape et affichons la réponse.
306	PS+	Préparons d'abord les informations pertinentes et établissons un plan. Ensuite, répondons à la question étape par étape (attention au bon sens et à la cohérence logique). Ensuite, répondons à la question étape par étape (en faisant attention au bon sens et à la cohérence logique).	Tout d'abord, préparons les informations pertinentes et établissons un plan. Ensuite, répondez aux questions étape par étape (en faisant preuve de bon sens et de cohérence logique).
307	PS+	Comprenons d'abord le problème, extrayons les variables pertinentes et les chiffres correspondants, élaborons et concevons un plan complet. Ensuite, exécutons le plan, calculons les variables intermédiaires (attention au calcul numérique correct et au bon sens), résolvons le problème étape par étape, et Ensuite, réalisons le plan, calculons les variables intermédiaires (attention au calcul numérique correct et au bon sens), résolvons le problème étape par étape, et montrons la réponse.	Tout d'abord, il faut comprendre le problème, extraire les variables pertinentes et leurs valeurs correspondantes, et créer un plan complet. Ensuite, exécutons le plan, calculons les variables intermédiaires (en faisant attention aux calculs numériques corrects et au bon sens), résolvons le problème étape par étape et affichons la réponse.

7. désambiguïsation des questions

Il est important d'écarter activement les ambiguïtés possibles dans les questions basées sur l'expérience, car les grands modèles de raisonnement sont prêts à vous aider à "supposer" des questions, comme dans l'exemple erroné mentionné plus haut, où la mauvaise question conduit à la mauvaise supposition et à la mauvaise réponse.

8. choisir entre la longueur de l'entrée et la profondeur du raisonnement.

Les entrées trop longues inhibent le raisonnement et diffusent les problèmes de raisonnement, tandis que les entrées courtes renforcent le raisonnement et maintiennent la concentration, ce qui s'exclut mutuellement.

9. contrôler le format du contenu de sortie

Voir "4", le cadre des mots repères. La dernière section pourrait ajouter [Format de sortie] pour contraindre le format du contenu de sortie du grand modèle.

Il existe deux types de formats de contenu de sortie de contrôle :

1. la typographie

Exemple 1 : Sortie utilisant le formatage markdown et la mise en page du contenu

Exemple 2 : L'article produit peut être collé dans Word pour être utilisé.

2.Gabarit

Exemple 1 : Générer un article à diviser en trois parties : introduction, explication et résumé

Exemple 2 :prompt : résumés des discussions de groupe, notes de réunion, telles que les conversations à plusieurs voix

Lecture approfondie sur DeepSeek-R1

DeepSeek-R1 WebGPU : Exécutez DeepSeek R1 1.5B localement dans votre navigateur !

Tifa-DeepsexV2-7b-MGRPO : un modèle qui supporte les jeux de rôle et les dialogues complexes, avec des performances supérieures à 32b (avec installateur en un clic)

Mise en œuvre d'une base de connaissances locale/API basée sur DeepSeek-R1 et accès au BOT WeChat

DeepSeek Official Pick : Un guide d'outils d'IA pratiques avec l'intégration de DeepSeek R1

DeepSeek R1 Jailbreak : une tentative de passer à travers les censeurs de DeepSeek

Entraînez votre propre modèle d'inférence R1 de DeepSeek avec Unsloth

Tutoriels pratiques sur l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

PixVerse教程：Discord中使用 /Animate 使您的图像转换为栩栩如生的视频

PixVerse Tutoriel : Utiliser /Animate dans Discord pour donner vie à vos images en vidéo !

Tutoriels pratiques sur l'IA # PixVerse

il y a 1 an

017.8K

Comment contrôler la taille de la carte et utiliser d'autres options de mise en page dans Gamma

Tutoriels pratiques sur l'IA

il y a 1 an

025.3K

Exécutez ComfyUI avec BizyAir Cloud Node pour des habillages de modèles gratuits en un clic !

Tutoriels pratiques sur l'IA

Il y a 8 mois

014.8K

Déploiement local des grands modèles QwQ-32B : un guide simple pour les PC

Tutoriels pratiques sur l'IA

Il y a 6 mois

015.9K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Un tutoriel pour apprendre au commun des mortels à comprendre et à utiliser correctement DeepSeek-R1

contextes

Où utiliser DeepSeek-R1