최대한 질문의 요소를 나눠 고민해 보기.
한 때, 분석계를 운영하면서 영업과 마케팅 분들의 데이터 추출을 도와주고 분석계 시스템의 모델링을 담당했던 적이 있다. 이 쪽에서 일하다 보면 종종 이해가 되지 않는 질의를 만날 때가 있다. 첫 번째는 이전에 추출해드렸던 동일한 조건의 데이터를 기간만 다르게 다시 요청하는 경우였고 두 번째는 임원분들로부터 받은 질의를 그대로 들고 오는 경우였다. 한두 번 요청하는 경우는 그런대로 견딜만하였다. 하지만 본인이 받은 질의를 제대로 이해하지 못하는 경우는 바로 업무량의 대폭 증가로 이어지곤 했다. 대신 숙제를 해야 하는 상황이었으니 그럴 만도 했다. 결국 이런 상황을 타개하기 위해 팀별로 한 명씩을 소집해서 한 자리에 모아놓고 데이터 분석 방법과 바르게 질문하는 것은 어떤 것인가에 대해 교육하기로 하였다.
장장 8시간이 넘는 시간의 교육 동안 대다수의 현업분들은 임원분들로부터 받는 그분들 나름대로의 고충을 호소하곤 하였다. 물론 그럴만했다. 그분들의 경험과 인사이트가 결합되어 몇 수 앞을 바라보는 질문은 누가 봐도 한눈에 답을 내놓을 수는 없는 것이었다. 그런 분들에게 내가 제시한 것은 우선 질의를 그대로 문장으로 적어본 뒤 Divide and Conquer, 즉 문제를 최대한 쪼개 보라는 것이었다. 그다음에, 문장을 명사, 동사 단위로 나누어 최대한 단순 조회가 가능한 레벨까지 다시 쪼갠다음 다시 그 정의를 하나씩 조합해가면서 데이터를 말아 올리라고 조언하곤 했다.
예를 들어 특정 기간 중 특정 채널에서 특정 물건을 구입한 활성 고객이 주로 동시에 구매한 상품을 알아봐야 한다고 치자. 그러면 저 문장은 특정 기간/특정 채널/특정물건 구매/활성/고객/동시에 구매한 상품 등으로 나눠볼 수 있다. 이런 식으로 가장 구해야 하는 고객 리스트부터 천천히 접근하면서 데이터를 말아 올리면 된다. 그리고 이런 과정에서 발생하는 어려움이 있다면 그때 질의를 하면 된다. 이런 상황에서 오는 질의는 처음 받았던 질의에 비해서는 분명히 처음의 질의보다는 100% 구체적이고 다양한 변수들이 제거된 상태일 것이다. 즉, 흔히 말하는 "갑" 스러운 질문보다 더 나은 상급의 질문이다.
앞서 설명한 접근 방식을 하루 종일 반복시키니 확실히 현업분들이 던지던 질문의 형식은 이전보다 더 구체화되기 시작하였고 질문도 이전보다 더 날카로워졌다. 이렇게 끝나면 앞으로 더 효과적인 데이터 분석 및 모델링이 가능하겠구나... 기대가 되었다. 하지만 결론적으로, 변한 것은 없었다. 효과적인 데이터의 활용은 업무량을 증가시킬 것이라고 생각한 그들은 이전과 동일한 질문과 업무 행태를 반복하였다. 그때 나는 한 가지 추가적인 교훈을 얻을 수 있었다. 결국 좋은 질문은 아무리 스킬이 있어도 충분한 의지 없이는 절대 나올 수 없다는 것을 말이다.