<AI 제품을 처음 만들게 된 PM에게> 브런치북 시리즈 - 후속편 #2
AI 제품을 만들다 보면 이런 경험을 하게 됩니다.
하나의 실험이 다음 단계로 나아가기 위한 단서가 되지 못하고, 결론도 못 낸 채 다시 제자리로 돌아가 버리는 경우. 혹은 실험이 목적지를 향한 방향 확인이 아니라, 옆길로 새다 못해 아예 숲 속에서 길 잃는 기분이 되는 경우. 실험을 위한 실험을 하고 있다는 불길한 느낌이 엄습해 오는 상황들...
저 역시 그런 경험을 꽤나 많이 한 것 같습니다.
그리고 그때마다 깨달은 건, 단순히 실험을 더 자주, 더 많이 하는 것만으로는 부족하다는 사실이었습니다.
스프린트 일정에 쫓겨 임팩트 없는, 학습되기 어려운 실험을 계속 이어가는 게 가장 안 좋은 시나리오였죠.
많은 팀이 AI를 붙였다 → 결과가 이상하다 → 왜 그런지 모르겠다는 수순을 밟습니다.
실패해도 정확한 원인 분석이 어렵고, 개선 방향을 잡지 못한 채 '일단' 다음 실험으로 넘어가 버리곤 하죠.
이는 AI 자체의 문제가 아니라, 실험이 구조화되어 있지 않기 때문입니다.
AI 제품은 본질적으로 불확실성이 큰 영역입니다.
"많이 해보면 답 나오겠지"라는 마음으로 무작정 시도하다 보면, 답은커녕 더 많은 물음표만 남는 경우가 허다합니다.
실험적 접근과 문화를 갖추는 건 당연히 중요합니다.
하지만 더 중요한 건, 실험이 학습으로 이어질 수 있도록 구조를 설계하는 것입니다.
구조가 없으면 실패는 낭비가 됩니다.
잘 준비한 구조가 있으면 실패는 학습이 되고, 다음 단계의 자산이 됩니다.
실험 설계서는 단순히 체크리스트가 아닙니다.
✔️ 우리가 풀려는 문제와 가설은 무엇인가?
✔️ 성공 기준은 어디에 두어야 하는가?
✔️ 실험 단위는 모델/프롬프트/UX/브랜딩 중 어디인가?
✔️ 실패했을 때 원인을 추적할 수 있는가?
이 질문들을 팀 전체가 동일한 프레임에서 합의하도록 만드는 장치가 바로 설계서입니다.
AI 제품이 흔들리지 않고 앞으로 나아가기 위해 필요한 최소한의 구조이기도 합니다.
다음 편에서는 제가 실제 작성한 [GenAI 실험 설계서]를 공개합니다.
모델 성능을 넘어, 프롬프트, 인터페이스(CUX), 브랜딩 톤(BX)까지 실험 단위로 확장해 검증할 수 있는 구조를 담았습니다.
실험이 더 이상 혼란이 아니라 축적된 학습으로 이어지도록,
AI 제품을 만드는 팀이라면 반드시 갖추어야 할 최소한의 프레임워크를 함께 공유하겠습니다.