(3편) Claude code 를 쓰면서 깨달은 3가지
2022년 11월 ChatGPT가 처음 나왔을 때, 기본적인 질문에도 틀린 답을 했습니다. 불과 3년이 지난 지금, AI 없이 일을 하는 게 오히려 어색합니다. 챗봇을 넘어 "에이전트"를 직접 쓰기 시작하면서는 완전히 다른 세상이 왔다는 걸 실감합니다. AI 에이전트 도구 사용하면서 느낀 점을 계속 업데이트하고 기록해보고자 합니다. 3편은 실무적인 관점에서 적어 봤습니다.
첫 번째. '만들어달라'가 아니라 '뭐가 문제야'부터 시작합니다.
처음 AI 에이전트를 본격적으로 쓰기 시작했을 때 가장 많이 하는 실수는 이미 답을 정해두고 그 답을 만들어달라고 시키는 것이었습니다. "면담 체크리스트 만들어줘", "이 제도 설계해줘", "이 사안 정리해줘" 그러다가 어느 순간 그냥 물어봤습니다. "나는 지금 이런 상황인데, 진짜 문제가 뭔 것 같아?" 하고요.
결과가 달랐습니다. 내가 만들어달라고 했을 때 나오는 결과물과, 문제를 같이 정의한 다음에 나오는 결과물은 퀄리티 차이가 납니다. 특히 맥락이 많고, 이해관계가 복잡하고, 정답이 없는 영역에서는 더 그렇습니다. 요즘은 어떤 task든 작업 지시 전에 10~15분은 그냥 브레인스토밍 대화를 합니다. AI가 모른다고 전제하지 말고, 오히려 내가 모른다고 전제하고 대화를 시작하는 게 훨씬 좋은 결과를 냅니다.
두 번째. 기록 전담 에이전트를 하나 더 붙입니다.
AI와 길게 대화를 하다 보면 반드시 이런 순간이 옵니다. "아까 그 얘기 어떻게 결론 났더라?" 세션이 끊기면 맥락이 통째로 날아갑니다. 지금은 중요한 논의를 시작할 때 에이전트 하나를 따로 켜서 이렇게 시킵니다. "이 대화 전체를 실시간으로 회의록 형태로 정리해줘. 결정된 것, 미결 이슈, 주요 맥락 구분해서."
그러면 메인 대화는 메인 대화대로 흐르고, 에이전트가 병렬로 돌면서 구조화된 기록을 만들어 냅니다. 다음 세션을 열 때 이 기록을 붙여주면서 "이어서 진행해줘"라고 하면 됩니다. 새로 시작하는 느낌이 거의 안 납니다. 사람에게 회의록 제대로 써달라고 하면 잘 작성되는 경우가 많지 않습니다. 바빠서, 귀찮아서, 우선순위에서 밀려서. AI한테 맡기면 그게 그냥 기본값이 됩니다. 맥락 관리가 AI 활용의 핵심입니다.
세 번째. 피드백 루프를 끊지 않습니다.
AI 에이전트로 뭔가를 만들 때 흔히 하는 실수가 있습니다. 결과물이 나오면 바로 끝내는 것입니다. 어느 정도 완성되면 물어보며 개선해야 합니다. "이 구조에서 나중에 문제가 될 수 있는 지점이 어디야?" 혹은 "내가 놓친 게 있어?" 미처 생각 못했던 엣지 케이스, 확장성 문제, 의존성 이슈 같은 것들이 나옵니다. 거기에 사람의 판단을 얹고, 수정하고, 다시 물어봅니다. 이 루프를 3~4회 돌리고 나면 처음 결과물과 최종 결과물이 완전히 달라집니다.
딸깍 한 번으로 뭔가 나오는 건 맞습니다. 그런데 내가 원하던 제대로 된 결과물이 나오려면 피드백 루프에 내 생각을 얼마나 투자하느냐에 달려 있습니다. AI agent는 실행합니다. 그런데 얼마나 잘 실행하느냐는 결국 사람이 결정합니다.