일명: 생각의 사슬
연쇄 사고의 정의 및 근거
"연쇄 사고법"(줄여서 CoT)은 일련의 연결된 사고 단계로 구성된 사고의 사슬을 만드는 원리에 기반한 사고 방식입니다. 이 방법은 사고 과정을 일련의 정돈된 단계로 세분화함으로써 사람들이 문제에 대해 보다 체계적으로 사고하고 창의적인 아이디어를 창출할 수 있도록 도와줍니다. 이 방법은 혁신, 의사 결정, 문제 해결 등 다양한 사고 시나리오에 적용할 수 있습니다. CoT 방법의 핵심 아이디어는 큰 문제를 여러 개의 작은 문제로 세분화한 다음, 각 문제가 간단하고 명확한 방식으로 답을 찾을 수 있을 때까지 각각의 작은 문제를 더 작은 문제로 세분화하는 것입니다. 이렇게 하면 문제를 더 명확하게 이해하고 더 나은 해결책을 찾을 수 있습니다.
연쇄 사고는 각 조각이 문제의 한 측면을 나타내는 직소 퍼즐에 비유할 수 있으며, 이러한 조각을 연결해야만 완전한 답을 얻을 수 있습니다. 예를 들어, 새로운 지식을 배울 때 연쇄 사고를 사용하여 다양한 지식 포인트 간의 관계를 설정함으로써 지식을 더 잘 이해하고 기억할 수 있으며, 문제를 풀 때 연쇄 사고를 사용하여 문제를 여러 개의 하위 문제로 세분화한 다음 단계별로 해결하여 최종적으로 완전한 해결책을 얻을 수 있습니다. 솔루션을 얻을 수 있습니다.
빅데이터 분야의 해석
생각의 연쇄(CoT) 프롬프트 프로세스는 최근에 개발된 프롬프트 방법으로, 대규모 언어 모델이 추론 과정을 설명하도록 장려하는 프롬프트 방식입니다. 아래 그림은 몇 개의 샷으로 구성된 표준 프롬프트(왼쪽)와 생각의 사슬 프롬프트 프로세스(오른쪽)를 비교한 것입니다.

큰 모델이 이 문제를 완전히 정확하게 계산하도록 하는 방법에 대한 새로운 질문을 생각해 보세요:
닭은 하루에 6개의 알을 낳는데, 오늘 한 번 알을 모아서 절반을 먹었습니다. 다음날 다시 계란을 모아서 두 개를 먹었고, 3일째에 다시 계란을 모았는데 이제 몇 개의 계란이 남았나요?
존재Wei 외(2022) (새 탭에서 열기) (새 탭에서 열기)에 도입된 연쇄적 사고(CoT) 프롬프트는 중간 추론 단계를 통해 복잡한 추론 기능을 사용할 수 있도록 합니다. 이를 샘플이 적은 프롬프트와 결합하여 추론이 답에 앞서 이루어지는 복잡한 작업에서 더 나은 결과를 얻을 수 있습니다.
사고 연쇄의 주요 아이디어는 프롬프트에 답할 때 추론 과정을 표시하는 큰 언어 모델에 몇 가지 작은 예시를 보여줌으로써 추론 과정을 샘플로 설명하는 것입니다. 이러한 추론에 대한 설명은 종종 더 정확한 결과로 이어집니다.
실제 사례
CoT 연쇄 사고는 일상 생활 곳곳에서도 찾아볼 수 있습니다. 예를 들어, 요리를 할 때는 먼저 재료를 준비한 다음 요리하고 마지막으로 서빙해야 합니다. 이것이 전형적인 CoT 연쇄 사고 과정입니다. 예를 들어 새로운 지식을 배울 때는 먼저 기본을 이해하고 나서 고급 내용을 배워야 합니다.
연쇄 사고는 각 조각이 문제의 한 측면을 나타내는 직소 퍼즐에 비유할 수 있으며, 이러한 조각을 연결해야만 완전한 답을 얻을 수 있습니다. 예를 들어, 새로운 지식을 배울 때 연쇄 사고를 사용하여 다양한 지식 포인트 간의 관계를 설정함으로써 지식을 더 잘 이해하고 기억할 수 있으며, 문제를 풀 때 연쇄 사고를 사용하여 문제를 여러 개의 하위 문제로 세분화한 다음 단계별로 해결하여 최종적으로 완전한 해결책을 얻을 수 있습니다. 솔루션을 얻을 수 있습니다.
장점과 단점
생각의 연쇄(CoT)는 사고의 과정을 유기적으로 연결된 일련의 단계로 세분화하여 사고의 효율성과 질을 향상시키는 사고 방식입니다. 다음과 같은 장점이 있습니다:
1. 사람들이 아이디어의 흐름을 더 잘 정리하고 제어하여 더 나은 문제 해결로 이어지도록 돕습니다.
2. 지속적인 사고 지원 및 창의적 사고 촉진.
3. 사고 과정을 추적함으로써 사고의 질을 더 잘 점검하고 최적화할 수 있습니다.
4. 조직에서 혁신에 이르는 복잡한 문제를 해결하는 데 사용할 수 있습니다.
CoT의 단점:
1. CoT는 방대한 지식 기반과 분석 기술이 필요하며 초보자에게는 적합하지 않습니다.
2. CoT는 시간과 노력이 필요하며 시간 제약이 있는 상황에서 사용하기 어렵습니다.
3. 사람마다 사고 패턴이 다를 수 있으므로 CoT가 사람마다 최선의 사고 방식이 아닐 수도 있습니다.
COT 방법의 분류
CoT는 쉬운 문제에서는 잘 작동하지만 어려운 문제에서는 작동하지 않습니다. 그리고 최소에서 최대 프롬프트는 주로 어려운 문제를 푸는 데 사용됩니다.
가장 적은 프롬프트부터 가장 많은 프롬프트까지
질문을 더 간단한 하위 질문으로 세분화한 다음 그 하위 질문에 하나씩 답하여 원래 질문에 대한 답을 얻는 최소한의 프롬프트 아이디어도 매우 간단합니다:

위의 방법 외에도 프롬프트에 몇 개의 샘플(몇 장)을 추가하면 결과를 크게 향상시킬 수 있는 또 다른 트릭이 있습니다. 이 트릭은 CoT에서도 발견되며 결과를 개선할 수 있는 매우 다재다능한 방법입니다.
이 문서에서는 구체적인 구현에서 서로 다른 작업을 위해 다음 두 가지 주요 프롬프트 구조를 설계했습니다(프롬프트의 일부 샘플은 생략):
1. 이 문제를 분석해 보겠습니다.
이 접근 방식은 다음과 같습니다.한 번 호출LLM을 사용하여 하위 문제를 먼저 생성한 다음 각 하위 문제에 대한 해답과 최종 해답을 생성합니다. 따라서 LLM의 출력을 표준화하는 것은 주로 샘플에 달려 있습니다.

2."****"을 풀려면 먼저 "****", "****", "****", ...을 풀어야 합니다. subproblem2>**", "****", ...
이 접근 방식은 다음과 같습니다.반복(수학)하위 질문에 대한 답을 생성하고 모든 정보를 요약한 다음 최종 답을 생성합니다.

프롬프트에서 사용하는 특정 단서 단어(**해석** 또는 **처음 풀기**)는 중요하지 않으며, 중요한 것은 다음과 같습니다.먼저 하위 작업으로 세분화하세요.다시 한 번사례별 답변사고 과정.
효과:



© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...