TP99, Dive Deep, Documentation
쿠팡을 다닐 때는 당연한 것들인 줄 알았는데, 퇴사 후에야 이게 얼마나 강력한 도구였는지 새삼 깨닫게 된다. 쿠팡에서 배운 가장 중요한 3가지에 대해 기록해 보려 한다.
쿠팡에서 근무하며 매일같이 보고, 매주 리뷰하는 수치는 대부분 TP99라는 단어와 연관된다. 이건 Top Percentile 99의 약자로, 전체 사용자 중 가장 운이 나쁜 하위 1%의 경험을 의미한다.
쉽게 말해 100명의 셀러가 센터에 물건을 입고시키려 한다고 가정했을 때, 그중 가장 늦게 입고된 99번째 셀러의 경험을 측정한다는 뜻이다. 이 99번째의 지체는 시스템 에러일 수도, 작업자의 단순 실수일 수도, 상상 가능한 모든 실수와 에러가 결합된 결과물이다. 쿠팡은 바로 이 지점을 성과 지표로 삼는다. 평균과 중간값은 분석 때 참고만 할 뿐, 내 성과는 오로지 TP99로만 측정받는다.
왜 그럴까? 평균을 보면 "대부분 잘 돌아가네"라는 결론이 나지만, TP99를 보면 "누군가는 지금 고통받고 있네"라는 결론을 내게 되기 때문이다. 평균은 일반적인 성능 유지에 집중하게 만들지만, TP99는 시스템의 안정성과 신뢰도에 집중하게 만든다.
반품 처리를 예(수치는 가상의 수치) 로 들면, 평균은 "2일이면 처리된다"고 안심시키지만, TP99는 "2주째 환불을 못 받은 고객이 1%나 있다"고 경고한다. 그래서 TP99는 모든 논의의 중심이며, 여기서 발생한 문제를 해결하기 위해 모든 리소스를 투입한다. 100번 중 1번 발생하는 문제를 해결하기 위해 매주 강하게 챌린지받는 상황은 업무 강도의 근원이기도 하지만, 그만큼 지독하게 고객의 신뢰를 지켜내는 방식이기도 하다.
TP99에서 발견된 문제를 해결하기 위해서는 문제의 근본 원인(Root Cause)까지 파고들어야 한다. 특정 센터의 입고 리드타임이 6일이나 걸린 케이스를 예로 들어보자.
제일 먼저 데이터를 본다. 해당 주차의 전체 센터 캐파는 어땠는지, 포캐스팅보다 물량이 많이 들어왔는지, 그에 맞춰 리소스 확보는 제대로 되었는지 등을 살핀다. 보통 "데이터를 볼 줄 안다"는 친구들은 여기까지 접근한다. 하지만 내가 재직하던 당시 쿠팡의 내 리더들은 그 이상을 원했다.
그랬기에 나는 SQL로 정리된 데이터만 보는 게 아니라, 직접 WMS 로 들어갔다. 해당 오더의 모든 개별 아이템 이동 경로 (쿠팡은 Random Stow 라는 방법론을 쓰기 때문에, 경우에 따라선 SKU 단위가 아닌 입고된 낱개 수량만큼 데이터를 봐야하는 경우도 생긴다. 그리고 많은 경우 SQL 은 이러한 디테일을 통합해서 보여주기에 의도치 않게 중요한 데이터가 누락되기도 한다) 와 그 과정에서 남겨진 작업자들의 코멘트를 하나하나 다 살펴봤다. SQL로 뽑은 정제된 데이터에는 보이지 않는 현장의 디테일들이 이 안에 남아 있기 때문이다.
만약 특정 작업대에서 장기 적치되어 있었다면, 센터 매니저에게 유선으로 확인을 요청하고, 답변이 충분치 않으면 직접 센터에 방문했다. 실제 작업자와 함께 현장 상황을 확인하고 다시 논의해야만 진짜 해결책이 나오기 때문이다.
TP99로 문제를 찾고 Dive Deep으로 원인을 파악했다면, 마지막은 문서화다. 쿠팡은 여전히 대부분의 문서를 AI의 도움 없이 직접 작성한다. 쿠팡에서 내가 작성한 문서는 곧 '나의 분신'이다. 내가 없어도 이 문서가 유관부서와 리더들에게 문제의 정의, 백업 데이터, 가설, 실행, 결과, 로드맵을 완벽하게 설명해 줄 수 있어야 한다. (동시에 내 업무량을 줄여준다. 누군가 질문을 한다면, 미팅으로 설명하기보다는 문서만 제공해주는 것으로 서포트를 끝낼 수 있기 때문이다.)
중요한 프로젝트나 크리티컬한 문제는 Word 파일 4~5장 분량의 '줄글' 형태로 준비된다. 요약본이 아닌 상세한 맥락이 담긴 논문이다. 미팅이 시작되면 참석자들은 15분간 조용히 그 문서를 정독하며 댓글로 날 선 질문과 반대 의견을 남긴다. 이 과정에서 내용을 온전히 내 것으로 만들지 못한 사람은 살아남지 못한다. 단순히 대놓고 욕을 먹는 수준을 넘어, 리더와 동료들로부터 신뢰를 크게 잃게 된다. 글쓰기는 단순한 기록이 아니라 내 머릿속의 논리를 가장 정교하게 가다듬는 과정이기에, 쿠팡의 동료들은 여전히 직접 긴 글을 써 내려간다.
다양한 환경과 맥락에서 이 방식들을 적용해 보려 했지만, 현실적인 제약도 분명 존재했다.
가장 중요한 건 리더십의 의지와 시스템적인 뒷받침이다. TP99는 극한의 퍼포먼스를 내기 위한 방법인데, 이 정도 서비스 레벨까지 올려야 할지에 대해서는 회사 상황마다 의견이 다를 수 있다. 또, Dive Deep을 하려면 디테일한 데이터를 빠르게 취합하고 분석할 수 있는 기초 체력이 먼저 갖춰져야 한다.
문서화 역시 마찬가지다. 리더들이 높은 수준의 문서 작업을 요청하고 이를 바탕으로 깊이 있게 논의하는 문화가 없다면 글쓰기는 낭비로 치부되기 쉽다. 특히 경력이 길지 않은 친구들이 많은 스타트업의 경우, 글자가 가득한 아마존 스타일의 문서를 읽는 것 자체를 거부할 가능성도 높다.
하지만 그럼에도 불구하고, 쿠팡에서 배운 이 세 가지는 내가 어떤 환경에 있든 문제의 본질을 타격하는 가장 강력하고 매력적인 무기임이 분명하다. 환경이 허락한다면, 혹은 환경을 만들어서라도 꼭 적용하고 싶은 일하는 방식이다.