AKA: Cadeia de pensamento
Definição e justificativa para a Cadeia de Pensamento
"Chain-of-Thought" (CoT) é um método de pensamento baseado no princípio de criar uma cadeia de pensamento que consiste em uma série de etapas de pensamento vinculadas. O método ajuda as pessoas a pensar de forma mais sistemática sobre os problemas e a gerar ideias criativas, dividindo o processo de pensamento em uma série de etapas ordenadas. O método é aplicável a uma variedade de cenários de pensamento, como inovação, tomada de decisões, solução de problemas etc. A ideia central do método CoT é dividir um grande problema em vários problemas menores e, em seguida, dividir cada um dos problemas menores em problemas ainda menores até que cada problema possa ser respondido de forma simples e inequívoca. Dessa forma, é possível entender o problema com mais clareza e encontrar uma solução melhor.
Podemos comparar a Cadeia de Pensamento a um quebra-cabeça, em que cada peça representa um aspecto de um problema, e somente conectando essas peças podemos obter uma resposta completa. Por exemplo, quando estamos aprendendo um novo conhecimento, podemos usar a Cadeia de Pensamento para estabelecer a relação entre vários pontos de conhecimento, de modo a entender e lembrar melhor o conhecimento; quando estamos resolvendo um problema, podemos usar a Cadeia de Pensamento para dividir o problema em vários subproblemas e, em seguida, resolvê-los passo a passo para finalmente obter uma solução completa. solução completa.
Interpretação do campo de big data
O processo de solicitação Chain of Thought (CoT) é um método de solicitação desenvolvido recentemente que incentiva modelos de linguagem grandes a explicar seus processos de raciocínio. A figura abaixo mostra uma comparação do prompt padrão de poucas tentativas (esquerda) com o processo de prompt Chain of Thought (direita).
Crie uma nova pergunta sobre como fazer com que o modelo grande calcule essa pergunta de forma absolutamente correta:
Uma galinha põe seis ovos por dia. Hoje, recolhi os ovos uma vez e comi metade deles. No dia seguinte, coletei os ovos novamente e comi dois deles e, no terceiro dia, coletei os ovos novamente. Quantos ovos me restam agora?
existirWei et al. (2022) (abre em uma nova guia)Os prompts do Chained Thinking (CoT) introduzidos em permitem recursos de raciocínio complexos por meio de etapas intermediárias de raciocínio. Você pode combinar isso com prompts com menos exemplos para obter melhores resultados em tarefas mais complexas em que o raciocínio precede a resposta.
A ideia principal do encadeamento de pensamento é explicar o processo de raciocínio em amostras mostrando um pequeno número de exemplos para o modelo de linguagem grande, que também exibe o processo de raciocínio ao responder aos prompts. Essa explicação do raciocínio geralmente leva a resultados mais precisos.
Exemplos da vida real
O CoT Chain Thinking também pode ser encontrado em toda parte na vida cotidiana. Por exemplo, quando cozinhamos, precisamos primeiro preparar os ingredientes, depois cozinhá-los e, por fim, servi-los. Esse é um processo típico de pensamento em cadeia da CoT. Por exemplo, quando aprendemos um novo conhecimento, precisamos primeiro entender o básico e depois aprender o conteúdo avançado.
Podemos comparar a Cadeia de Pensamento a um quebra-cabeça, em que cada peça representa um aspecto de um problema, e somente conectando essas peças podemos obter uma resposta completa. Por exemplo, quando estamos aprendendo um novo conhecimento, podemos usar a Cadeia de Pensamento para estabelecer a relação entre vários pontos de conhecimento, de modo a entender e lembrar melhor o conhecimento; quando estamos resolvendo um problema, podemos usar a Cadeia de Pensamento para dividir o problema em vários subproblemas e, em seguida, resolvê-los passo a passo para finalmente obter uma solução completa. solução completa.
vantagens e desvantagens
Chain-of-Thought (CoT) é um método de raciocínio que melhora a eficiência e a qualidade do pensamento, dividindo o processo de raciocínio em uma série de etapas organicamente vinculadas. Suas vantagens incluem:
1. ajudar as pessoas a organizar e controlar melhor o fluxo de ideias, o que leva a uma melhor solução de problemas.
2. apoio ao pensamento contínuo e promoção do pensamento criativo.
3. ao acompanhar o processo de pensamento, a qualidade do pensamento pode ser melhor verificada e otimizada.
4. pode ser usado para resolver problemas complexos que vão desde a organização até a inovação.
Desvantagens da CoT:
1. o CoT requer uma grande base de conhecimento e habilidades analíticas e não é adequado para iniciantes
2. o CoT exige tempo e esforço de raciocínio e é difícil de ser usado em situações de pouco tempo
3. os padrões de pensamento de cada pessoa podem ser diferentes, portanto, a CoT pode não ser a melhor maneira de pensar para pessoas diferentes.
Classificação dos métodos COT
Least-to-Most (dicas de menos para mais)
O CoT funciona bem em problemas fáceis, mas não em problemas difíceis. E o Least-to-Most Prompting é usado principalmente para resolver problemas difíceis.
Prompting do mínimo ao máximo
A ideia do Least-to-Most Prompting também é muito simples, pois consiste em dividir a pergunta em subperguntas mais simples e, em seguida, responder às subperguntas uma a uma para obter a resposta à pergunta original:
Além dos itens acima, outro truque é adicionar algumas amostras (few-shots) ao prompt, o que pode melhorar significativamente os resultados. Esse truque também é encontrado no CoT e é uma maneira muito versátil de melhorar os resultados.
No documento, as duas principais estruturas de prompt a seguir são projetadas para diferentes tarefas na implementação concreta (um pequeno número de amostras no prompt é omitido):
1) Vamos analisar esse problema.
Essa abordagem éinvocar uma vezLLM, de modo que ele gera subproblemas primeiro e, em seguida, gera a resposta para cada subproblema e a resposta final. Portanto, cabe em grande parte às amostras padronizar o resultado do LLM.
2) Para resolver o "****", precisamos primeiro resolver: "****", "****", "****", ... subproblema2>**", "****", ...
Essa abordagem éiteração (matemática)Gerar respostas para as subperguntas, resumir todas as informações e, em seguida, gerar a resposta final.
Entendo que as palavras-chave específicas usadas pelo prompt (**decompor** ou **primeiro resolver**) não são importantes, o que é importante é quePrimeiro, divida-o em subtarefasmais uma vezResposta caso a casoO processo de pensamento.
Efeito: