보니 개발지
최근 수많은 IT 서비스들이 저마다 'AI 에이전트'라는 타이틀을 달고 출시되고 있습니다.
하지만 내부를 들여다보면 사용자의 질문에 그저 답만 해주는 단순 LLM 래퍼(Wrapper)나 챗봇에 불과한 경우가 많습니다.
그렇다면 육아 및 전문가 코칭 플랫폼인 '보니(Bonny)'는 어떨까요? 보니의 시스템 아키텍처와 작동 방식을 통해,
이 서비스가 정말 'AI 에이전트'라고 불릴 자격이 있는지 기술적 관점에서 해부해 보겠습니다.
본격적인 분석에 앞서 'AI 에이전트'의 기능적 정의를 짚고 넘어갈 필요가 있습니다.
단순 챗봇은 사용자의 입력(Prompt)이 있어야만 수동적으로 응답을 산출합니다. 반면, AI 에이전트는 자율성(Autonomy)과 주도성(Proactivity)을 갖춘 시스템을 말합니다.
환경 인지 및 기억 (Memory): 과거의 대화와 사용자의 컨텍스트를 기억합니다.
자율적 추론 (Thought): 스스로 목표를 세우고 문제 해결을 위한 계획을 수립합니다.
능동적 실행 (Action): 알림을 보내거나 도구를 사용하여 사용자에게 먼저 다가갑니다.
완전 자율형 범용 에이전트(AGI 수준)라면 스스로 외부 병원 API를 연동해 예약을 끝내버리는 수준이겠지만, 현재 실무에서 쓰이는 훌륭한 에이전트는 '특정 도메인의 문제를 해결하기 위해 에이전트의 기본 구조에 얼마나 충실한가'로 평가받아야 합니다.
보니의 시스템 구조는 전형적인 에이전트 워크플로우를 충실히 따르고 있습니다.
대답만 하고 끝나는 AI가 아닌, 스스로 생각하고 행동하는 구조를 갖췄습니다.
3단계 프로세스: '사용자 고민(Input) ➔ 자율 분석 및 목표 수립(Thought) ➔ 독려 실행 및 해결(Output)'이라는 3단계 구조로 작동합니다.
자율적 두뇌 역할: 단순 응답을 넘어서, '과거의 기억(Memory)'과 현재의 '코칭 목표(Goal State)'를 바탕으로 AI가 스스로 분석하는 통합된 Hub(두뇌) 역할을 수행합니다.
챗봇과 에이전트를 가르는 가장 큰 차이는 세션을 넘나드는 '연속성'과 AI의 '주도성'입니다. 목표 지향적 코칭 시스템인 '이어보니'는 이 부분에서 높은 기술적 완성도를 보여줍니다.
백그라운드 목표 자동 생성: 사용자와의 대화 중 AI가 백그라운드에서 스스로 '코칭 목표'를 자동 생성합니다. 사용자가 잠든 새벽 시간대에는 대화 맥락을 분석하여 다음 날의 코칭 플랜을 준비합니다.
선제적 행동(Action): 다음 날 AI가 먼저 "어제 제안했던 핵심 솔루션 2가지... 해보셨나요?"라며 푸시 알림을 통해 실행을 독려합니다. 사용자가 먼저 말을 걸기 전에 AI가 능동적으로 개입하는 것입니다.
자율적 완료 감지: 지속적인 대화를 통해 문제 해결의 실마리가 보이면, AI가 스스로 이를 감지하여 해당 목표를 완료 처리하고 축하해 줍니다.
LLM이 특정 도메인에서 에이전트로 완벽히 동작하려면 지식을 정확하게 꺼내 쓰고 상황에 맞게 재구성해야 합니다. 보니는 이 과정에서도 고도화된 설계를 보여줍니다.
다차원 라벨링과 구조화: 고성능 RAG(검색 증강 생성) 검색을 위해 Vector DB를 활용합니다. 단순히 텍스트만 저장하는 것이 아니라, 사용자의 '숨은 의도(hidden_intent)', '아이의 기질(child_temperament)', '명시적 감정(explicit_emotion)' 등을 고밀도로 JSON화하여 다차원 라벨링을 수행합니다.
속도와 비용을 잡은 하이브리드 설계: 무겁고 비싼 LLM에만 의존하지 않습니다. 검증된 육아 해법에서 정답을 추출하는 'RAG' 기술과, 여기에 부드러운 말투와 공감을 입히는(Rewriting) '경량화 모델(Haiku)'을 최적으로 조합했습니다. 이를 통해 답변 품질은 유지하면서도 원가를 낮추고, 0.8초라는 초고속 응답 속도를 구현해 냈습니다.
물론 보니가 영화에 나오는 것처럼 세상의 모든 것을 다 해주는 만능 범용 AI는 아닙니다.
하지만 '육아'라는 명확하고 민감한 도메인 안에서, 사용자의 데이터를 고밀도로 기억하고, 자율적으로 코칭 목표를 설정하며, 선제적으로 알림과 솔루션을 제공한다는 점에서 'AI 에이전트'라는 명칭은 결코 과장이 아닙니다.
이것이 바로 보니가 단순한 챗봇을 넘어 지금의 복합적인 에이전트 구조로 설계된 진짜 이유입니다.
육아라는 가장 따뜻한 영역에서 부모와 아이가 더 행복한 내일을 그릴 수 있도록 돕는 것.
"기술로 읽고 사람으로 완성한다(High Tech, High Touch)"는 철학이 아키텍처 깊숙이 녹아든 보니(Bonny)의 앞으로의 진화가 더욱 기대되는 이유입니다.