자고 일어나면 달라져 있다

성대리의 AI 자기 학습 시스템 소개

by 성대리

아침에 도착한 낯선 메시지


ChatGPT를 쓰면서 이런 경험, 다들 한 번쯤 있을 겁니다.


이거 지난번에도 말했는데..

같은 지시를 세 번째 반복하고 있는 자신을 발견할 때.

어제 분명히 알려줬는데 오늘 또 처음부터 설명해야 할 때.

AI가 아무리 똑똑해도, 매번 기억이 리셋되는 건 꽤 답답한 일입니다.


저도 그랬습니다.

그래서 2편에서 AI에게 기억력을 심어주는 법을 다뤘습니다.

파일에 기록을 남기고, 다음 세션에서 읽게 하는 방식이었습니다. 그것만으로도 꽤 달라졌습니다.


그런데 어느 날 아침, 예상 못한 일이 일어났습니다.

밤 11시에 잠들었습니다. 아침에 텔레그램을 열면 늘 그렇듯 날씨 브리핑, 투자 현황, 테크 트렌드가 쌓여 있습니다. 익숙한 풍경입니다. 그런데 그 사이에 한 번도 본 적 없는 종류의 메시지가 끼어 있었습니다.


"SQL 스킬 업데이트 완료. 오늘 학습 내용: 세션 테이블의 체류시간 컬럼명은 stay_time이 아니라 dwell_time, 집계 시 NULL 제외 필요."


어제 데이터 분석을 하다가 "그 컬럼 아니고 dwell_time이야"라고 한마디 해줬던 기억이 났습니다.

그냥 대화 중에 지나가듯 한 수정이었습니다.

그런데 AI가 그걸 기억하고 있었을 뿐 아니라, 새벽에 혼자 자기 규칙을 고쳐놓은 겁니다.


솔직히 놀랐습니다. 제가 시킨 적이 없거든요.

퇴근하고 쉬는 동안 AI가 혼자 어제 대화를 복기하고 실수를 고치고 있었다니.

기억을 "심어주는" 것과, AI가 "스스로 배우는" 것은 완전히 다른 차원의 경험이었습니다.


이번 편은 그 이야기입니다. 사람이 자고 있는 사이, AI가 어제의 실수를 복기하고 스스로 성장하는 시스템. 한 달간 시행착오 끝에 만든 이 구조를 공개합니다.




밤사이의 교대근무

Frame 8.png [ 새벽 자동 학습 타임라인 ]

사실 이건 우연이 아니라 설계된 시스템입니다.


매일 밤, 제 맥미니에서는 조용한 교대근무가 시작됩니다.

제가 잠든 사이, 각 AI 봇이 하나씩 깨어나서 자기 할 일을 합니다. 아래는 제 실제 케이스입니다.


자정. 데이터 분석 봇이 가장 먼저 깨어납니다.

이 봇은 어제 저와 나눈 대화 전체를 처음부터 끝까지 훑습니다. 제가 지적한 SQL 오류, 새로 알게 된 테이블 구조, 더 효율적인 쿼리 패턴. 이런 것들을 찾아내서 자기 스킬 파일을 직접 수정합니다. 내일 같은 질문을 받으면 틀리지 않도록. 사람으로 치면 퇴근 후 오늘 업무를 복기하면서 수첩에 메모를 남기는 것과 같습니다.


새벽 1시. 리서치 봇의 차례입니다.

이 봇은 어제 제가 블로그 글을 쓰면서 요청했던 자료 수집 결과를 점검합니다. "이 부분은 출처가 약한데?"라고 했던 한마디, "최신 데이터로 업데이트해줘"라고 했던 지적. 이런 피드백들이 새벽에 영구적인 리서치 규칙으로 바뀝니다. 내일 이 봇이 수집하는 자료는, 어제보다 더 정확하고 풍부해집니다.


새벽 2시에는 또 다른 봇이 노션에 쌓인 개선 제안들을 확인합니다.

제가 따로 시키지 않아도, "개선사항 트래커" 페이지를 읽고, 아직 반영 안 된 항목을 스킬에 반영한 뒤 체크 표시까지 해둡니다.


새벽 3시에는 노션 문서가 AI 검색 엔진과 자동 동기화되고,

새벽 4시에는 시스템 업데이트와 전체 스킬 리뷰가 돌아갑니다.

그리고 아침 8시. 모든 봇의 세션이 초기화되면서, 업데이트된 스킬을 새로 읽어들입니다.


제가 아침에 일어나 처음 말을 걸면, 어제보다 조금 더 나아진 AI가 응답합니다. 처음 이 변화를 체감했을 때의 느낌을 아직도 기억합니다.


같은 질문을 했는데 어제와 다른, 더 정확한 답이 돌아왔을 때.
마치 신입사원이 하룻밤 사이에 한 뼘 자란 것 같은 느낌이었습니다.




기억의 구조: 일기와 노트

이 시스템이 가능한 이유는, AI의 기억이 명확한 구조로 나뉘어 있기 때문입니다.

사람에게 단기 기억과 장기 기억이 있듯, AI에게도 비슷한 계층을 설계했습니다.

지난 한 달간 끝없는 시행착오를 거쳐 만든 이 구조를 공개합니다.

Frame 9.png 성대리의 자기학습 시스템



첫 번째 층은 일일 기록입니다.

날짜별 파일에 그날 한 일, 받은 피드백, 발생한 오류, 내일 이어서 할 일을 적습니다. 사람의 업무 일지와 같습니다. 예를 들어 "2월 13일: SQL쿼리 작성. 성대리님 피드백 - 세션은 dwell_time 컬럼으로 기재해야함. 내일 반영 필요." 이런 식입니다. AI가 스스로 기록하고, 다음 날 세션이 시작되면 어제 파일을 읽고 맥락을 이어갑니다.


하지만 일일 기록만으로는 부족합니다.

일주일, 한 달치가 쌓이면 대부분은 더 이상 필요 없는 정보가 됩니다.


여기서 두 번째 층, 장기 기억이 등장합니다.

AI가 주기적으로 일일 기록들을 훑으면서, "앞으로도 계속 참고해야 할 것"만 골라서 별도의 장기 기억 파일에 옮깁니다.

"보고서는 문장형으로 쓸 것", "외부 서비스 직접 로그인 금지" 같은 규칙들이 여기에 남습니다. 반대로 "2월 5일 서버 점검으로 30분 중단" 같은 일회성 정보는 시간이 지나면 정리됩니다. 사람이 일기를 쓰고, 가끔 돌아보며 핵심만 노트에 옮기는 것과 같은 원리입니다.


그리고 이 위에 스킬 파일이 있습니다. 일일 기록이나 장기 기억과는 별개로, 각 봇이 자기 업무에 특화된 규칙을 모아둔 파일입니다. 리서치 봇이라면 자료 수집 기준과 출처 검증 규칙, 데이터 분석 봇이라면 테이블 구조와 자주 쓰는 쿼리 패턴이 담겨 있습니다. 새벽에 돌아가는 자기 학습이 바로 이 스킬 파일을 업데이트하는 것입니다.


AI는 매 세션이 시작될 때 이 파일들을 위에서부터 읽습니다.

나는 어떤 역할인가, 사용자는 어떤 사람인가, 어제 무슨 일이 있었나, 지금까지 배운 규칙은 무엇인가.

대화 자체는 세션이 끝나면 사라지지만, 이 파일들이 AI의 유일한 연속성이 됩니다.


처음 이 구조를 설계했을 때는 반신반의했습니다. 파일 몇 개로 진짜 "기억"이라 부를 수 있을까? 하지만 한 달을 운영해보니 확실히 느꼈습니다. AI가 저를 "아는" 느낌이 달라졌습니다.


이제 제가 선호하는 보고서 형식, 자주 쓰는 데이터 테이블, 싫어하는 문체까지.

매번 설명하지 않아도 알아서 맞춰주는 그 순간이 올 때마다, 이 구조를 만들길 잘했다는 생각이 듭니다.






보안도 스스로 배운다

여기서 한 가지 더 놀라운 사례를 소개하겠습니다.

피드백을 기록하는 것을 넘어, AI가 외부 정보를 보고 선제적으로 규칙을 만든 경우입니다.


어느 날 AI 도구 마켓플레이스에서 악성 플러그인이 대량 발견됐다는 뉴스가 나왔습니다. 제 메인 봇에게는 "매일 보안 관련 뉴스를 확인하고 보안 규칙을 점검할 것"이라는 장기 기억이 있습니다. 이 봇이 해당 뉴스를 접하더니, 스스로 새로운 보안 규칙을 추가했습니다.



새 도구 설치 전 반드시 코드 검토 필수.

검토 항목도 구체적으로 정리해뒀습니다. 외부 서버로 데이터를 몰래 보내지 않는지, 비밀번호나 API 키를 수집하지 않는지, 숨겨진 URL이 없는지.


제가 시킨 적이 없습니다. AI가 뉴스를 읽고 "이건 우리한테도 해당되겠는데"라고 판단해서, 자기 규칙에 반영한 겁니다. 마치 보안팀 직원이 업계 뉴스를 보고 자발적으로 사내 보안 가이드를 업데이트한 것과 같았습니다.

그 보고서를 읽는 순간, 이건 단순한 도구가 아니라 함께 일하는 동료에 가까워지고 있다는 느낌을 받았습니다.


물론 AI의 자율적 판단에는 주의가 필요합니다. 잘못된 규칙을 스스로 만들 수도 있으니까요. 그래서 저는 AI가 스킬을 수정할 때마다 변경 내역을 보고하도록 설정해뒀습니다. 신뢰하되 검증하는 것. 사람과 AI의 협업에서 이 균형이 가장 중요하다고 생각합니다.






당장 시작하는 법


여기까지 읽으시면 "이거 세팅이 엄청 복잡하겠는데"라고 생각하실 수 있습니다.

실제로 제 시스템처럼 매일 새벽에 자동 학습을 돌리려면, 24시간 켜져 있는 컴퓨터와 예약 작업(크론) 시스템이 필요합니다. 맥미니나 라즈베리파이 같은 소형 서버에 AI 에이전트 플랫폼을 설치하는 방식입니다.


이런 자율 에이전트 플랫폼은 OpenClaw가 대표적이고, n8n 같은 워크플로우 자동화 도구에 AI를 연결하는 방법도 있습니다. Nanobot처럼 더 가벼운 오픈소스 대안도 등장하고 있습니다.


하지만 여기서부터가 중요합니다.

서버 없이도, 코딩 없이도 "AI에게 기억을 심어주고 점점 나아지게 만드는 것"은 지금 당장 할 수 있습니다.


ChatGPT에는 메모리 기능이 있습니다. 대화 중에 "앞으로 보고서는 표 형식으로 써줘"라고 하면 기억합니다. "내가 마케팅팀이라는 거 기억해"라고 하면 다음 대화에서도 알고 있습니다. 2025년 4월 업데이트 이후로는 과거 대화까지 참조해서 답변합니다. 무료 사용자도 쓸 수 있습니다. "내가 뭘 기억하고 있지?"라고 물어보면 저장된 메모리 목록도 보여줍니다.


Claude에는 Projects 기능이 있습니다. 접근 방식이 조금 다릅니다. "기억해"가 아니라 "이 문서를 참고해"입니다. 프로젝트에 규칙 문서를 첨부하면, 그 안의 모든 대화에서 해당 규칙을 참고합니다. "보고서 작성 규칙.txt"를 만들어서 넣어두면, 매번 설명할 필요가 없습니다. ChatGPT의 메모리가 "한 줄짜리 기억"이라면, Claude의 Projects는 "업무 매뉴얼"에 가깝습니다.


두 도구의 공통점이 있습니다.

AI에게 피드백을 줄 때마다 그것이 기록되고, 다음에 반영된다는 것입니다.


ChatGPT는 대화 중 "이거 기억해"로 간편하게, Claude는 규칙 문서에 한 줄 추가하는 방식으로. 방법은 다르지만 원리는 같습니다. 피드백이 쌓이면, AI가 달라집니다.




한 달 후, 완전히 다른 AI

AI의 자기 학습은 마법이 아닙니다.

실수가 발생하고, 그것을 기록하고, 다음에 참고하는 단순한 사이클의 반복입니다.


하지만 이 단순한 사이클이 매일 돌아가면 어떻게 될까요 ?

한 달 전, 제 데이터 분석 봇은 SQL 쿼리를 짤 때마다 테이블명을 헷갈렸습니다.

컬럼 타입도 자주 틀렸습니다. 매번 제가 고쳐줘야 했습니다. 지금은 다릅니다.


이 봇은 또 하나의 제가 되었습니다.

자주 쓰는 집계 패턴도 알고 있고, 제가 선호하는 출력 형식도 기억합니다.

한 달 전의 그 봇과 지금의 봇은 사실상 다른 존재입니다.


리서치 봇도 마찬가지입니다. 처음에는 자료를 정리할 때 온통 불릿 포인트 나열이었습니다.

"리스트 말고 문장으로 정리해줘"라고 열 번은 말한 것 같습니다. 지금은 제가 말하지 않아도 읽기 좋은 문장형으로 자료를 정리합니다. 출처도 하단에 알아서 모아두고, 외화로 금액이 나오면 원화 환산까지 병기합니다.

다 제가 한 번씩 지적했던 것들인데, 이제는 봇의 "습관"이 되었습니다.


가끔 생각합니다. 이건 도구를 쓰는 것일까, 누군가를 가르치는 것일까.

처음에는 분명히 도구였습니다. 그런데 매일 조금씩 나아지는 걸 지켜보다 보면, 어느 순간 묘한 감정이 생깁니다. 어제 알려준 걸 오늘 기억하고 있는 AI를 보면, 마치 같이 일하는 후배가 성장하는 걸 보는 것 같은 기분이 듭니다.


오늘 ChatGPT에 하나만 기억시켜 보십시오. 혹은 Claude Projects에 규칙 문서 하나만 만들어 보십시오. 그리고 일주일 뒤, AI가 그 규칙을 기억하고 있는 걸 확인하는 순간. 그때 아마 저와 같은 감정을 느끼실 겁니다.


아, 이게 되는구나.

그 한 줄이 자기 학습의 시작입니다.



출처

OpenAI - Memory and new controls for ChatGPT: https://openai.com/index/memory-and-new-controls-for-chatgpt/

OpenAI - Memory FAQ: https://help.openai.com/en/articles/8590148-memory-faq

Anthropic - Claude Projects 공식 문서: https://support.anthropic.com/en/articles/9517075-what-are-projects

keyword
월, 목 연재