CoT (Chain-of-Thought) Cadena de pensamiento

Base de conocimientos de IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

37.1K 00

Alias: Cadena de pensamiento

Definición y justificación de la cadena de pensamiento

La "Cadena de Pensamiento" (CoT, por sus siglas en inglés) es un método de pensamiento basado en el principio de crear una cadena de pensamiento que consiste en una serie de pasos de pensamiento enlazados. El método ayuda a la gente a pensar de forma más sistemática sobre los problemas y a generar ideas creativas, descomponiendo el proceso de pensamiento en una serie de pasos ordenados. El método es aplicable a una gran variedad de escenarios de pensamiento, como la innovación, la toma de decisiones, la resolución de problemas, etc. La idea central del método CoT es descomponer un problema grande en varios problemas más pequeños y, a continuación, descomponer cada uno de los problemas más pequeños en otros aún más pequeños hasta que cada problema pueda responderse de forma sencilla y sin ambigüedades. De este modo, se puede entender el problema con mayor claridad y encontrar una solución mejor.

Podemos comparar la Cadena de Pensamiento con un rompecabezas, en el que cada pieza representa un aspecto de un problema, y sólo conectando estas piezas podemos obtener una respuesta completa. Por ejemplo, cuando estamos aprendiendo un nuevo conocimiento, podemos utilizar la cadena de pensamiento para establecer la relación entre varios puntos de conocimiento y así comprender y recordar mejor el conocimiento; cuando estamos resolviendo un problema, podemos utilizar la cadena de pensamiento para dividir el problema en múltiples subproblemas y luego resolverlos paso a paso para obtener finalmente una solución completa. completa.

Interpretación del campo de los macrodatos

La cadena de pensamiento (CoT) es un método desarrollado recientemente que anima a los grandes modelos lingüísticos a explicar sus procesos de razonamiento. La siguiente figura muestra una comparación entre el método estándar de pocos disparos (izquierda) y el proceso de la Cadena de Pensamiento (derecha).

Inventa una nueva pregunta sobre cómo conseguir que el gran modelo para calcular esta pregunta sea absolutamente correcto:
Una gallina pone seis huevos al día. Hoy he recogido los huevos una vez y me he comido la mitad. Al día siguiente he vuelto a recoger los huevos y me he comido dos, y al tercer día he vuelto a recoger los huevos, ¿cuántos huevos me quedan ahora?

existeWei et al. (2022) (se abre en una nueva pestaña)Las instrucciones de pensamiento encadenado (CoT) introducidas en permiten capacidades de razonamiento complejas a través de pasos de razonamiento intermedios. Puede combinarlo con menos ejemplos para obtener mejores resultados en tareas más complejas en las que el razonamiento precede a la respuesta.

La idea principal del encadenamiento de pensamientos es explicar el proceso de razonamiento en muestras mostrando un pequeño número de ejemplares al modelo de lenguaje amplio, que también muestra el proceso de razonamiento al responder a las indicaciones. Esta explicación del razonamiento suele dar lugar a resultados más precisos.

Ejemplos de la vida real

El pensamiento en cadena del TdC también puede encontrarse en todas partes de la vida cotidiana. Por ejemplo, cuando cocinamos, primero tenemos que preparar los ingredientes, luego cocinarlos y, por último, servirlos. Se trata de un típico proceso de pensamiento en cadena CoT. Por ejemplo, cuando aprendemos un nuevo conocimiento, primero tenemos que entender lo básico y luego aprender el contenido avanzado.

ventajas y desventajas

La cadena de pensamiento (CdT) es un método de pensamiento que mejora la eficacia y la calidad del pensamiento al dividir el proceso de pensamiento en una serie de pasos vinculados orgánicamente. Entre sus ventajas se incluyen:

1. Ayudar a las personas a organizar y controlar mejor el flujo de ideas, lo que permite resolver mejor los problemas.
2. Apoyo al pensamiento continuo y fomento del pensamiento creativo.
3. El seguimiento del proceso de pensamiento permite comprobar y optimizar la calidad del mismo.
4. Puede utilizarse para resolver problemas complejos que van desde la organización a la innovación.

Desventajas de CoT:

1. El CdT requiere una gran base de conocimientos y capacidad de análisis, por lo que no es apto para principiantes.
2. El CdT requiere tiempo y esfuerzo de reflexión y es difícil de utilizar con poco tiempo.
3. Los patrones de pensamiento de cada persona pueden ser diferentes, por lo que el TdC puede no ser la mejor forma de pensar para diferentes personas.

Clasificación de los métodos COT

De menos a más (Consejos de menos a más)

CoT funciona bien en problemas fáciles, pero no en los difíciles. Y Least-to-Most Prompting se utiliza principalmente para resolver problemas difíciles.

De menos a más preguntas

La idea del Least-to-Most Prompting también es muy sencilla, y consiste en descomponer la pregunta en subpreguntas más sencillas y, a continuación, responder a las subpreguntas una a una para obtener la respuesta a la pregunta original:

Además de lo anterior, otro truco consiste en añadir unas cuantas muestras (few-shots) al prompt, lo que puede mejorar significativamente los resultados. Este truco también se encuentra en CoT, y es una forma muy versátil de mejorar los resultados.

En el documento, se diseñan las siguientes dos estructuras principales de prompt para diferentes tareas en la aplicación concreta (se omite un pequeño número de muestras en el prompt):

1. Desglosemos este problema.

Este enfoque esinvocar una vezLLM, de modo que primero genera subproblemas y luego genera la respuesta a cada subproblema y la respuesta final. Así que depende en gran medida de las muestras normalizar la salida del LLM.

2.Para resolver "****", primero tenemos que resolver: "****", "****", "****", ...

Este enfoque esiteración (matem.)Genere respuestas a las subpreguntas, resuma toda la información y, a continuación, genere la respuesta final.

Entiendo que las palabras clave específicas utilizadas por prompt (**break down** o **first solve**) no son importantes, lo importante es quePrimero divídalo en subtareasuna vez másrespuesta caso por casoEl proceso de pensamiento.

Efecto: