체인 오브 쏘트 — 생각을 단계별로 펼쳐라

by 박현아

친구에게 고민을 털어놓는다. "이직할까 말까." 친구가 묻는다. "왜?" 대답이 막힌다. 연봉이 불만인 건지, 상사가 싫은 건지, 성장이 멈춘 건지, 아니면 그냥 월요일이 싫은 건지. 전부 다인 것 같기도 하고, 어느 것도 결정적이지 않은 것 같기도 하다.


"모르겠어, 그냥 다 싫어."


이 문장이 나오는 순간, 사고가 멈춘다. '다 싫다'는 감정이지 분석이 아니다. 감정은 신호로서 유용하지만, 감정만으로는 판단이 안 된다. 그런데 우리는 놀라울 정도로 자주 감정 단계에서 결론을 내린다.




AI 연구에서 2022년에 발표된 작은 논문 하나가 큰 변화를 만들었다. 구글 연구진의 "Chain-of-Thought Prompting." 핵심은 단순했다.


AI에게 답만 내놓으라고 하면 틀린다. 하지만 "단계별로 생각해봐(Let's think step by step)"라고 한 문장을 추가하면, 정답률이 극적으로 올라간다.


수학 문제를 예로 들면 이렇다. "카페에 23명이 있었다. 8명이 나가고 12명이 들어왔다. 몇 명인가?" 답만 내놓으라고 하면 모델은 가끔 틀린다. 하지만 중간 과정을 쓰게 하면 — "23에서 8을 빼면 15, 15에 12를 더하면 27" — 거의 틀리지 않는다.


왜일까. 모델이 더 똑똑해진 게 아니다. 같은 모델이다. 달라진 건 사고의 중간 단계를 명시적으로 펼쳤다는 것뿐이다. 머릿속에서 한 번에 점프하는 대신, 한 단계씩 밟으니까 실수가 줄어든다.




사람의 사고도 마찬가지다. 다만, 사람은 중간 단계를 건너뛰는 데 너무 익숙하다.


"그 사람 별로야." 왜? "그냥 느낌이." 느낌을 펼쳐보면 — 첫 만남에서 눈을 안 맞췄다 관심이 없다고 해석했다 무례하다고 판단했다 "별로"라는 결론. 네 단계를 거쳤는데, 의식에는 '느낌'만 남았다.


문제는 두 번째 단계에 있다. '눈을 안 맞춘 것'을 '관심 없음'으로 해석한 건 여러 가능성 중 하나일 뿐이다. 수줍음일 수도 있고, 문화 차이일 수도 있고, 그날 컨디션이 안 좋았을 수도 있다. 하지만 단계를 펼치지 않으면 이 해석이 검증 없이 결론으로 직행한다.


체인 오브 쏘트는 이 자동화된 점프를 의도적으로 느리게 만드는 기술이다.


실전에서 어떻게 쓸까. 세 가지 장면.


첫째, 중요한 결정 앞에서.


"이 프로젝트를 계속할까, 접을까?"


점프: "감이 안 좋아, 접자."

체인 오브 쏘트: 왜 감이 안 좋지? 지난달 성과가 기대 이하였다 기대치가 현실적이었나? 시장 평균과 비교하면? 비교해보니 실은 평균 이상이었다 기대치가 과했던 거다 접을 이유가 아니다.


같은 출발점에서 정반대 결론에 도달할 수 있다. 차이는 중간 단계를 밟았느냐 뿐이다.


둘째, 감정이 격해졌을 때.


"화가 난다." 여기서 멈추면 화를 내거나 참는 것, 두 가지 선택만 보인다. 펼쳐보면 — 뭐에 화가 났지? 회의에서 내 의견이 무시됐다 '무시'라고 느낀 근거는? 팀장이 내 발언 후에 바로 다른 주제로 넘어갔다 의도적이었을까? 시간이 부족해서였을 수도 있다 확인해보자.


감정을 부정하는 게 아니다. 감정의 원인을 단계별로 추적하는 것이다. 추적하면 대응이 정밀해진다. "화난다"에서 출발한 것이 "팀장에게 회의 시간 배분에 대해 이야기해보자"로 바뀐다.


셋째, 글을 쓸 때.


"이 주제로 글을 써야 하는데 뭘 쓸지 모르겠다." 이것도 점프다. 주제와 완성된 글 사이의 거리가 너무 멀어서 막막한 것이다. 체인으로 쪼개면 — 이 주제에서 내가 가장 흥미로운 점은? 독자가 가장 공감할 지점은? 도입부에 어떤 장면을 놓을까? 첫 문장은? 한 단계씩 내려가면 '뭘 쓸지 모르겠다'는 막막함이 사라진다.




체인 오브 쏘트가 작동하는 이유는, 인간의 작업 기억(Working Memory)에 한계가 있기 때문이다.


심리학에서는 작업 기억의 용량을 '매직 넘버 7±2'라고 부른다. 한 번에 머릿속에 올려놓을 수 있는 정보 단위가 5~9개라는 뜻이다. 복잡한 문제는 이 용량을 초과한다. 변수가 10개, 20개가 되면 머릿속에서 동시에 처리할 수 없다.


해법은 두 가지다. 머리를 키우거나, 문제를 쪼개거나. 머리를 키울 수는 없다. 문제를 쪼갤 수는 있다.


체인 오브 쏘트는 큰 문제를 작업 기억 안에 들어오는 크기로 분해하는 것이다. 각 단계에서는 한두 가지만 판단하면 된다. 그리고 그 판단을 적어두면(외부 기억), 다음 단계에서 앞 단계를 기억할 필요도 없다. 17장의 RAG와 통하는 지점이다 — 다 기억하지 말고, 기록하라.


반론이 있다. "직관이 더 빠르고 정확할 때도 있지 않나?"


맞다. 체스 그랜드마스터는 수를 하나하나 분석하지 않는다. 노련한 소방관은 건물이 무너지기 직전의 '느낌'을 안다. 게리 클라인의 연구에 따르면, 전문가의 직관은 수만 시간의 경험이 압축된 패턴 인식이다.


하지만 두 가지 조건이 있다. 첫째, 해당 분야에서 충분한 경험이 축적되어 있을 것. 둘째, 환경이 규칙적이고 예측 가능할 것.


이직, 투자, 관계의 중대한 결정 — 이런 것들은 두 조건을 충족하지 않는다. 경험이 적고, 환경이 불규칙하다. 이런 영역에서 직관을 믿는 것은 패턴 없는 곳에서 패턴을 보는 것이다. 16장의 할루시네이션이다.


규칙은 간단하다. 익숙한 영역에서는 직관을 믿어라. 낯선 영역에서는 단계를 펼쳐라.




한 가지 더. 체인 오브 쏘트의 가장 과소평가된 효과는 커뮤니케이션이다.


"A라고 생각합니다." 이렇게 말하면 상대방은 동의하거나 반대한다. 논쟁이 된다.


"B라는 데이터가 있고, 거기서 C라는 패턴을 발견했고, 그래서 A라고 생각합니다." 이렇게 말하면 상대방은 B를 검증하거나, C의 해석을 논의하거나, A 이외의 가능성을 제시한다. 대화가 된다.


결론만 던지면 논쟁이 되고, 과정을 보여주면 협업이 된다. AI에게 "단계별로 생각해봐"라고 시키는 것처럼, 사람 사이에서도 사고의 중간 단계를 공유하면 소통의 질이 달라진다.




"그냥 다 싫어." 이 문장으로 돌아가자.


다 싫다는 건 신호다. 무언가 잘못되었다는 신호. 그 자체로 유효하다. 하지만 거기서 멈추면 아무것도 바뀌지 않는다.


한 단계만 더 가보자. 뭐가 제일 싫어? 그다음, 왜? 그다음, 그게 바뀔 수 있는 건가? 그다음, 바꾸려면 뭐가 필요해?


네 단계. 1분이면 된다. 그런데 이 1분이 "다 싫어"와 "이걸 바꿔보자" 사이의 거리다.


생각을 단계별로 펼쳐라. AI도 그렇게 하니까 정확해진다. 사람은 더 그래야 한다. 우리는 AI보다 점프를 잘하고, 그래서 AI보다 자주 틀린다.




"명확하게 사고한다는 것은, 한 번에 하나의 생각만 한다는 것이다." — 폴 발레리