에이전틱 AI와 알고리즘의 관계
[1편] 스마트폰(갤럭시 S26)에 탑재된 에이전틱 AI
[2편] AI 에이전트와 에이전틱 AI의 차이
[3편] 인간 두뇌를 초월할 수 있는 추론의 시작
[4편] 알고리즘에 스스로 갇히다
[5편] 1mm의 틈, AI 거울 앞에 선 인간의 욕망(연재인 관계로 사전에 발행하지 못함)
[6편] 연출된 자율성 속의 에이전트 AI
■ 에이전틱 AI의 추론이 특정 영역에서 인간의 수행 능력을 초월하기 시작하는가?
에이전틱 AI가 ‘스스로 목표를 향해 나아간다’고 할 때, 그 내부에서는 실제로 어떤 일이 벌어지고 있을까?
그 답은 시장에 심부름 나간 아이를 관찰해 보면 찾을 수 있다. 아이의 몸속에는 지시를 이해하는 두뇌, 이동하는 손과 발, 당부를 잊지 않는 기억이 있으며, 무엇보다 상황에 따라 유연하게 판단을 내리는 ‘추론 알고리즘’이 실시간으로 작용하고 있다.
그리고 이 모든 움직임의 시작점에는 가장 중요한 전제가 있다. 바로 ‘오늘 저녁에는 맛있는 불고기를 해 먹자’라는 엄마의 명확한 요구 사항이다. 아이는 이 목표를 가슴에 품고 현관문을 나선다.
본격적인 설명에 앞서, 혹시 ‘심부름하는 아이’의 기본 개념이 낯설다면 전편인 『AI 에이전트와 에이전틱 AI의 차이』를 먼저 읽어 보기를 권한다.
이 글에서 필자는 에이전틱 AI의 구조를 인간의 사유 방식과 연결해 보고자 한다. 도입부에서는 인간 지능과의 유기적 연관성을 살피고, 결론에서는 인간의 ‘메타인지’와 ‘사유의 본질’이 에이전틱 AI의 구성 요소와 어떻게 결합하는지 서술할 것이다. 결과적으로 독자 여러분은 이 글을 통해 에이전틱 AI의 기술적 구조와 더불어, 인공지능 시대를 살아가는 우리가 어떻게 사유해야 하는가에 대한 실마리를 얻게 될 것이다.
첫째, 두뇌: 대형 언어 모델(LLM)
아이가 심부름을 할 수 있는 기본 전제는 언어와 세상에 대한 이해이다. ‘불고기’가 무엇인지, ‘정육점’이 어떤 곳인지 알아야 하듯, 에이전틱 AI의 핵심 엔진은 대형 언어 모델(LLM, Large Language Model)이다.
LLM은 방대한 데이터를 학습하여 언어를 이해하고 상식적인 추론을 수행하는 ‘지적 토대’가 된다. 하지만 인간의 지능이 단순히 지식의 양으로 결정되지 않듯, LLM만으로는 자율적인 행동 능력을 갖추지 못한다. 에이전틱 AI는 이 지능 위에 행동(action)과 기억(memory)의 프레임워크를 얹어 비로소 스스로 움직이는 사유의 생명력을 얻는다.
둘째, 생각하는 방식: 추론 알고리즘
시장에 나선 아이는 단순히 목적지만 보고 직선으로 움직이지 않는다. 예상치 못한 상황에 직면하면 계획을 수정한다. 에이전틱 AI는 다음과 같은 알고리즘을 통해 인간의 전략적 사고 과정을 구현한다.
● ReAct(Reasoning + Acting): 아이가 “고기가 없네(관찰) → 옆 마트로 가야겠다(추론) → 이동한다(행동)”와 같이 생각과 행동을 반복적으로 교차하는 방식이다. 이는 인간이 환경과 상호 작용하며 실시간으로 판단을 교정하는 ‘적응적 사고’를 모방한 것으로, 2022년 Google Research에서 발표한 프레임워크이다.
● Chain of Thought(CoT, 생각의 사슬): 복잡한 문제를 작은 단계로 쪼개어 순차적으로 해결하는 방식이다. 우리가 논리적 난제를 만났을 때 “우선 이것부터 해결하고, 그다음에는 ……”이라며 생각의 사슬을 잇는 것과 같다. 단순히 답을 출력하는 것이 아니라, 중간 추론 과정을 명시적으로 생성함으로써 정확도를 높이는 것이 핵심이다.
● Tree of Thoughts(ToT, 생각의 나무): 하나의 선택지만 따라가는 CoT와 달리, 여러 갈림길에서 다양한 추론 경로를 동시에 시뮬레이션하는 방식이다. 바둑 기사가 여러 수를 미리 읽듯 가능성의 나무를 펼쳐 보고 가장 유망한 경로를 선택하는 고도의 전략적 사고를 구현한다. 다만 이 방식은 계산 비용이 크기 때문에 모든 상황이 아니라 고난도 문제 해결에 선택적으로 활용된다.
셋째, 손과 발: 도구 사용(tool use)
우리가 도구의 인간(Homo Faber)인 것처럼, 에이전틱 AI 역시 지능을 외부 세계로 확장한다. 아이가 지갑을 열고 장바구니에 물건을 담듯, AI도 웹 검색, 코드 실행, API 호출, 파일 시스템 접근 등 다양한 도구를 사용한다.
여기서 중요한 것은 ‘언제 어떤 도구를 쓸지 스스로 판단한다’는 점이다. 단순히 기능이 많은 것이 아니라, 상황에 맞춰 도구를 선택하고 그 결과를 다시 추론에 반영하는 능숙함이 AI를 수동적인 프로그램에서 능동적인 ‘에이전트’로 진화시킨다.
넷째, 기억: 메모리 구조(memory)
심부름을 끝내고 돌아오는 길에 “간장은 꼭 국산으로 사라”는 엄마의 최초 당부를 잊지 않는 힘, 그것이 바로 메모리이다. 에이전틱 AI의 기억은 역할에 따라 크게 둘로 나뉜다.
● 단기 메모리(short-term memory): 현재 진행 중인 작업의 맥락, 즉 방금 수행한 행동의 결과나 대화의 흐름을 유지한다. 아이가 “방금 고기를 샀으니 이제 채소를 살 차례다.”라고 인지하는 것과 같다. 기술적으로는 LLM의 컨텍스트 윈도(context window)가 이 역할을 담당하며, 처리할 수 있는 정보의 양에는 한계가 존재한다.
● 장기 메모리(long-term memory): 과거의 경험, 실패 사례, 사용자의 선호 방식 등을 외부 데이터베이스나 벡터 저장소에 저장하여 필요할 때 불러온다. “지난번 그 정육점은 고기 질이 별로였으니 다른 곳으로 가자.”는 식의 축적된 판단 근거를 통해 시간이 지날수록 더 정교한 결정을 내리게 된다.
에이전틱 AI가 복잡한 작업 중 판단 오류를 일으키거나 맥락을 잃는다면, 그것은 대개 단기 메모리인 컨텍스트 윈도의 용량 한계에 부딪혔거나 장기 메모리에서 적절한 정보를 검색·추출하는 능력이 미흡하기 때문이다. 따라서 안정적인 메모리 설계는 에이전틱 AI의 성능을 좌우하는 핵심 척도가 된다.
결론: 에이전틱 AI, 인간 사유의 확장과 메타인지의 실현
지금까지 살펴본 네 가지 요소, LLM(두뇌), 추론 알고리즘(생각 방식), 도구 사용(손과 발), 메모리(기억)의 결합은 단순한 기술적 진보를 넘어 인간 사유 방식의 기계적 구현이라 할 수 있다.
우리가 사유한다고 할 때, 우리는 단순히 정보를 처리하는 것이 아니라 ‘내가 무엇을 알고 무엇을 모르는지’, 그리고 ‘목표를 위해 지금 어떤 도구와 지식을 꺼내야 할지’를 끊임없이 판단한다. 이것을 심리학에서는 ‘메타인지(metacognition)’라고 부른다. 에이전틱 AI는 바로 이 메타인지의 과정을 알고리즘으로 구현한 것이다.
여기서 우리가 주목해야 할 중요한 지점이 있다. 바로 에이전틱 AI의 추론이 특정 영역에서 인간의 수행 능력을 초월하기 시작했다는 사실이다.
그동안 우리는 인공지능이 언제 인간의 두뇌를 전반적으로 앞지를 것인가에만 몰두해 왔다. 그러나 더 현실적인 변화는 이미 진행 중이다. 에이전틱 AI는 특정 유형의 추론과 정보 처리에서 인간이 따라가기 어려운 임계점에 도달하고 있다.
인간의 사유는 감정과 피로, 기억의 왜곡에 영향을 받는다. 반면 알고리즘으로 구축된 AI의 사유 시스템은 수천 가지의 ‘생각의 나무(ToT)’를 동시에 펼치고, 방대한 장기 메모리를 순식간에 검색하며, 가장 효율적인 도구를 즉각적으로 실행한다. 이 압도적인 속도와 규모의 사유 시스템이 가동되기 시작한 것이다.
물론 그럼에도 불구하고 인간만이 가진 고유의 영역은 존재한다. 데이터로 환원할 수 없는 미묘한 감각, 정답이 없는 0과 1 사이에서 의미를 찾아내는 사유, 그리고 맥락과 감정이 뒤엉킨 복잡한 인간관계 속에서의 판단이 그것이다.
결국 에이전틱 AI를 이해하는 것은 인간인 우리가 어떻게 생각하고 행동하는지를 객관화하여 들여다보는 과정과 같다. 네 가지 톱니바퀴가 맞물려 돌아가는 에이전틱 AI는 인간 사유의 한계를 보완하고 확장하는 강력한 ‘지적 파트너’로서 우리 곁에 자리하게 될 것이다.
이 작가의 멤버십 구독자 전용 콘텐츠입니다.
작가의 명시적 동의 없이 저작물을 공유, 게재 시 법적 제재를 받을 수 있습니다.
오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠