인공지능 시대의 소프트웨어 공학
흥미롭게 보고 있는 컨텍스트 엔지니어링에 대한 논문이 지인들의 SNS를 통해 눈에 띄었습니다. 마침 관련 기사를 번역해서 마침 요즘IT에 기고한 다음이라 가급적 컨텍스트 엔지니어링에 대한 생각이 생생할 때 빠르게 훑어보기로 했습니다.
원문은 <Awesome Context Engineering> 페이지에서 찾을 수 있습니다.
arXiv: https://arxiv.org/abs/2507.13334
Hugging Face Papers :https://huggingface.co/papers/2507.13334
훑어보는 방식을 두 가지 행동을 병행했습니다. 하나는 논문을 썸네일 수준에서 쭉 스크롤했던 것인데, 그러다가 도식을 보게 되었습니다. 굉장히 직관적이고 집약적인 그림들이 눈에 띄었습니다. 두 번째 행동이 조금 더 의도적인 행동인데, 바로 구글 노트북LM을 이용해 짧게(A1지 한 장 분량) 요약해 달라고 한 것입니다.
결과물은 2쪽 수준(11pt)이었는데, 가장 눈에 띄는 내용은 다음 문장이었습니다.
이 분야는 크게 세 가지 기초 구성 요소(Foundational Components)와 이를 통합하는 네 가지 시스템 구현(System Implementations)으로 나뉩니다.
그리고 해당 내용을 설명하는 내용이 요약 문서의 반을 넘습니다. 요약 품질을 믿는다면, 논문의 중심 내용이라 하겠네요.
혹시 이와 대응되는 도식이 있는지 논문에서 찾아보았습니다. 컨텍스트 엔지니어링 프레임워크라는 이름으로 구성 요소들이 시각적으로 잘 배치되고 집약된 그림이 있었습니다. 프레임워크는 크게 두 영역으로 나뉘어 있는데요.
앞서 요약문에서 발견한 '세 가지 기초 구성 요소'와 '네 가지 시스템 구현'과 그대로 대응시킬 수 있습니다. 그중에서 먼저 세 가지 기초 구성 요소에 대한 요약 내용을 (퍼플렉시티를 이용해서) 다시 표로 정리했습니다.
한편, 논문을 훑어보면 네 가지 시스템 구현에 대해서는 모두 도식화한 그림이 있었습니다. 그래서, 도식 내용과 요약문을 순차적으로 인용하여 배치해 보겠습니다. 첫 번째 구성 요소는 검색-증강 생성(Retrieval-Augmented Generation, RAG)입니다.
구글 노트북 LM 요약문 설명은 다음과 같습니다.
검색 증강 생성 (Retrieval-Augmented Generation, RAG): 외부 지식 통합을 통해 LLM의 성능을 향상하는 프레임워크입니다. 환각을 완화하고, 검색 정확도와 신뢰성을 향상합니다. 모듈형 RAG (Modular RAG), 에이전트 RAG (Agentic RAG Systems), 그래프 강화 RAG (Graph-Enhanced RAG)와 같은 다양한 아키텍처가 존재합니다.
논문 원문을 보면 그림에서 다룬 다양한 아키텍처에 대해 방대한 조사 결과가 있습니다. 개괄적인 설명과 함께 참조한 논문 원문 링크가 구체적으로 나열되어 있습니다.
두 번째는 맥락을 기억하게 하는 메모리 시스템입니다.
마찬가지로 구글 노트북 LM이 생성한 논문 요약을 인용합니다.
메모리 시스템 (Memory Systems): LLM이 이전 상호 작용에서 얻은 지속적인 정보를 유지하고 활용할 수 있도록 합니다. 이는 LLM이 사람처럼 인지적 상호작용을 할 수 있도록 지원하며, 단기 및 장기 메모리 아키텍처를 포함합니다.
세 번째 구성 요소는 도구 통합 추론입니다. 직관적 이해를 탁월하게 돕는 그림에 감탄합니다.
이번에도 요약 내용을 보겠습니다.
도구 통합 추론 (Tool-Integrated Reasoning, TIR): LLM을 수동적인 텍스트 생성기에서 동적인 도구 활용 및 환경 조작이 가능한 능동적인 세계 상호 작용자로 전환시킵니다. 이는 LLM이 외부 리소스와 동적으로 상호 작용하여 오래된 지식, 계산 부정확성 등의 근본적인 한계를 극복할 수 있도록 합니다.
마지막 구성 요소는 다중 에이전트 시스템입니다.
역시 요약 내용을 인용합니다.
다중 에이전트 시스템 (Multi-Agent Systems): LLM 기반 에이전트 간의 통신 및 오케스트레이션(조정)을 조정합니다. 통신 프로토콜 (Communication Protocols) (예: MCP, A2A)과 오케스트레이션 메커니즘 (Orchestration Mechanisms)은 에이전트 간의 효율적인 정보 교환과 협력을 가능하게 합니다.
논문 전문을 읽는 대신에 빠르게 훑어보며 얻게 된 것은 '컨텍스트 엔지니어링 프레임워크'였습니다. 이제 막 부상하는 기술 혹은 학문 영역이니 만큼 어휘나 각 개념들의 관계가 잘 정리된 프레임워크는 꽤 유용해 보였습니다. 앞서 언급한 요약 문서에도 이에 대한 내용이 있습니다.
이 조사는 컨텍스트 엔지니어링을 LLM 발전을 위한 필수적인 분야로 확립하며, 연구자와 엔지니어 모두에게 컨텍스트 인식 AI 발전을 위한 통합 프레임워크를 제공합니다.
끝으로 요약 문서 도입부에 있던 내용을 인용하며 글을 마치겠습니다.
컨텍스트 엔지니어링 (Context Engineering)은 대규모 언어 모델(LLM)의 추론 과정에서 제공되는 컨텍스트 정보의 체계적인 최적화를 포함하는 공식적인 학문 분야입니다. 이는 과거의 단순한 프롬프트 디자인을 넘어, 컨텍스트를 동적으로 구조화된 정보 구성 요소들의 집합으로 재개념화 합니다. 궁극적인 목표는 LLM 출력의 예상 품질을 극대화하는 이상적인 컨텍스트 생성 함수 집합(F)을 찾는 최적화 문제입니다. LLM의 성능은 근본적으로 제공되는 컨텍스트 정보에 의해 결정되며, 컨텍스트 엔지니어링은 이러한 모델의 행동을 유도하고, 지식을 증강하며, 역량을 발휘하는 주요 메커니즘 역할을 합니다.