CoT (Chaîne de pensée) Chaîne de pensée

Base de connaissances sur l'IAPosté il y a 1 an Cercle de partage de l'IA

9.3K 00

AKA : Chaîne de pensée

Définition et justification de la chaîne de pensée

La "chaîne de pensée" (CoT) est une méthode de réflexion basée sur le principe de la création d'une chaîne de pensée constituée d'une série d'étapes de réflexion liées entre elles. Cette méthode aide les gens à réfléchir de manière plus systématique aux problèmes et à générer des idées créatives en décomposant le processus de réflexion en une série d'étapes ordonnées. L'idée centrale de la méthode CoT est de décomposer un grand problème en un certain nombre de problèmes plus petits, puis de décomposer chacun des problèmes plus petits en problèmes encore plus petits jusqu'à ce que chaque problème puisse être résolu d'une manière simple et sans ambiguïté. De cette façon, on peut comprendre le problème plus clairement et trouver une meilleure solution.

Nous pouvons comparer la chaîne de pensée à un puzzle, où chaque pièce représente un aspect d'un problème, et ce n'est qu'en reliant ces pièces que nous pouvons obtenir une réponse complète. Par exemple, lorsque nous apprenons une nouvelle connaissance, nous pouvons utiliser la chaîne de pensée pour établir la relation entre les différents points de connaissance, afin de mieux comprendre et mémoriser la connaissance ; lorsque nous résolvons un problème, nous pouvons utiliser la chaîne de pensée pour décomposer le problème en plusieurs sous-problèmes, puis les résoudre étape par étape pour finalement obtenir une solution complète. solution complète.

Interprétation du domaine du big data

Le processus d'incitation de la chaîne de pensée (CoT) est une méthode d'incitation récemment mise au point qui encourage les grands modèles de langage à expliquer leurs processus de raisonnement. La figure ci-dessous montre une comparaison entre l'invite standard à quelques coups (à gauche) et le processus d'incitation de la chaîne de pensée (à droite).

Posez une nouvelle question sur la manière dont le grand modèle peut calculer cette question de manière tout à fait correcte :
Une poule pond six œufs par jour. J'ai ramassé les œufs une fois aujourd'hui et j'en ai mangé la moitié. Le lendemain, j'ai ramassé à nouveau les œufs et j'en ai mangé deux, et le troisième jour, j'ai ramassé à nouveau les œufs, combien me reste-t-il d'œufs ?

existentWei et al. (2022) (ouvre un nouvel onglet)Les invites "Chained Thinking" (CoT) introduites en permettent des capacités de raisonnement complexes par le biais d'étapes de raisonnement intermédiaires. Vous pouvez les combiner avec des invites sans échantillon afin d'obtenir de meilleurs résultats pour les tâches plus complexes où le raisonnement précède la réponse.

L'idée principale de l'enchaînement de pensées est d'expliquer le processus de raisonnement dans les échantillons en montrant un petit nombre d'exemples au grand modèle de langage, qui affiche également le processus de raisonnement lorsqu'il répond aux invites. Cette explication du raisonnement permet souvent d'obtenir des résultats plus précis.

Exemples concrets

La pensée en chaîne CoT est également omniprésente dans la vie quotidienne. Par exemple, lorsque nous cuisinons, nous devons d'abord préparer les ingrédients, puis les cuire et enfin les servir. Il s'agit là d'un processus typique de pensée en chaîne CoT. Par exemple, lorsque nous apprenons une nouvelle connaissance, nous devons d'abord comprendre les bases, puis apprendre le contenu avancé.

avantages et inconvénients

La chaîne de pensée (CoT) est une méthode de réflexion qui améliore l'efficacité et la qualité de la pensée en décomposant le processus de réflexion en une série d'étapes organiquement liées. Ses avantages sont les suivants

1. aider les gens à mieux organiser et contrôler le flux d'idées, ce qui permet de mieux résoudre les problèmes.
2. le soutien à la réflexion continue et la promotion de la pensée créative.
3. le suivi du processus de réflexion permet de mieux contrôler et d'optimiser la qualité de la réflexion.
4. peut être utilisé pour résoudre des problèmes complexes allant de l'organisation à l'innovation.

Inconvénients du CoT :

1. le CdT nécessite une large base de connaissances et des compétences analytiques et n'est pas adapté aux débutants
2. le CdT exige du temps et un effort de réflexion et il est difficile de l'utiliser dans des délais serrés
3. les schémas de pensée de chacun peuvent être différents, de sorte que la CdT peut ne pas être la meilleure façon de penser pour différentes personnes.

Classification des méthodes COT

Du moins au plus (Conseils du moins au plus)

Le CoT fonctionne bien pour les problèmes faciles, mais pas pour les problèmes difficiles. Quant à l'incitation la moins contraignante possible, elle est principalement utilisée pour résoudre les problèmes difficiles.

L'incitation la plus faible à l'incitation la plus forte

L'idée de l'incitation la moins contraignante est également très simple : il s'agit de décomposer la question en sous-questions plus simples, puis de répondre aux sous-questions une par une pour obtenir la réponse à la question initiale :

En plus de ce qui précède, une autre astuce consiste à ajouter quelques échantillons (few-shots) à l'invite, ce qui peut améliorer considérablement les résultats. Cette astuce, que l'on retrouve également dans CoT, est un moyen très polyvalent d'améliorer les résultats.

Dans le document, les deux principales structures d'invite suivantes sont conçues pour différentes tâches dans la mise en œuvre concrète (un petit nombre d'échantillons dans l'invite sont omis) :

1) Décortiquons ce problème.

Cette approche estinvoquer une foisLLM, de sorte qu'il génère d'abord des sous-problèmes, puis la réponse à chaque sous-problème et la réponse finale. C'est donc en grande partie aux échantillons qu'il revient de normaliser les résultats du LLM.

2 Pour résoudre "****", nous devons d'abord résoudre : "****", "****", "****", ... sous-problèmem2>**", "****", ...

Cette approche estitération (math.)Générer des réponses aux sous-questions, résumer toutes les informations et générer la réponse finale.

Je comprends que les mots-clés spécifiques utilisés par l'invite (**décomposition** ou **première résolution**) ne sont pas importants, ce qui est important c'est queCommencez par le diviser en sous-tâchesune fois de plusréponse au cas par casLe processus de réflexion.

Effet :