모든 데이터 PM은 PM이지만, 모든 PM이 데이터 PM은 아니다!
앞으로 몇 년에 걸쳐, 새로운 유형의 프로덕트 매니저(이하 PM)인 ‘데이터 프로덕트 매니저(이하 데이터 PM)’에 대한 수요가 증가할 것이다. 나는 이전에 좋은 데이터 과학자가 좋은 프로덕트 매니저를 만든다고 주장했지만, 그들만으로는 부족하다.
데이터는 제품 개발의 핵심이다. 사용 지표(usage metrics)나 A/B 테스트에 대한 사후 분석 만이 전부가 아니다. 데이터를 지속적으로 모으고, 쓰는 것이 제품의 행동 방식을 결정하고, 새로운 종류의 제품을 가능하게 한다. 머신러닝 모델은 제품을 유저의 선호도에 자동으로 적응하도록 하고, 유저의 다음 액션에 대한 추천을 제공하고, 미래의 기능이나 제품을 제안하기도 한다.
데이터 PM은 이것을 이해하고 제품에 녹여낼 수 있는 사람이다.
제품의 핵심에 데이터를 사용하려면 데이터 모델링, 데이터 인프라, 통계와 머신러닝에 대한 상당한 수준의 이해가 필요하다. 실험 결과를 이해하고 대시보드를 읽을 수 있는 것을 넘어서, 데이터의 흐름을 최대한 이용했을 때 어떤 것이 지금 가능하고, 어떤 것이 곧 가능해질 것인지에 대해 깊이 이해해야 한다.
전통적인 PM이 비즈니스, 엔지니어링, UX의 교차점에서 일했다면, 데이터 PM은 추가적으로 데이터와 데이터 과학에 대한 도메인 지식을 가져야 한다.
(좌) Drew Conway’s data science Venn diagram, (우) Martin Eriksson’s PM Venn diagram
데이터 PM은 데이터를 이용해 제품을 만들 때 데이터 전략이 필요하다는 것을 안다. 여기서 말하는 데이터 전략이란 데이터가 어떻게 생성되고, 수집되고, 이용될 것인지, 시장에서 독자적인 위치를 차지하기 위해 어떻게 기여할 것인지 등을 말한다.
분석을 위해서 데이터를 수집하고 데이터 웨어하우스에 적재하는 것 만으로는 부족하다. 데이터 PM은 제품에서 나온 데이터가 제품을 개선하는데 어떻게 사용될지, 장기적으로 제품의 성공 확률을 높여줄 해자를 어떻게 만들지 계획을 갖고 있어야 한다. 즉, 데이터 PM은 데이터와 함께 굴러가는 선순환 구조를 만들기 위해 제품과 관련된 의사결정을 한다.
데이터 PM은 제품을 만드는데 필요한 기술 인프라를 이해한다.
제품을 위해 어떤 종류의 인프라가 필요한지?
머신러닝 모델을 이용해 실시간으로 스코어링 할지, 아니면 오프라인으로 할지?
새로운 데이터를 이용한 모델 재교육은 어떻게 할 것인지?
모델 성능은 어떻게 평가할 것인지?
모델을 실제로 구현하기 위한 복잡도 비용은 얼마나 드는지?
물론 데이터 과학자도 이런 질문에 대해 잘 답변할 수 있을 것이다. 하지만 데이터 PM은 제품 개발의 트레이드오프를 결정하는 관점에서, 이러한 토론에 적극적으로 참여해야 한다.
데이터 PM은 데이터의 ‘수집’과 ‘사용’이 각각 다른 과정이며, 이 두 과정은 때로는 각기 다른 개발팀이 수행한다는 사실을 안다. 제품을 개발할 때 이 두 과정이 매끄럽게 연결될 수 있도록 하는 것도 데이터 PM의 일이다.
데이터 PM은 머신러닝이 많은 문제를 푸는 데에 도움이 되지만, 때로는 휴리스틱 모델이 더 적당할 수 있다는 것을 알고 있다. 해결방법이 명확하지 않은 경우 탐색적인 방법이 도움이 되기도 한다. 데이터 PM은 휴리스틱 모델을 사용하다가도 머신러닝 모델로 넘어가기 적당한 때가 온다는 것을 알고, 이 과정을 기획할 수 있다.
데이터 PM은 스스로 데이터 분석을 수행할 수 있다. 스스로 SQL을 작성하고, 대시보드를 만들고, 그들이 설계한 실험을 직접 해석한다. 그들은 “데이터가 스스로 말한다”라고 주장하는 사람들에 대해 회의적이다. 실험 결과를 얻는 것만큼이나 결과를 어떻게 분석했는지 아는 것이 중요하기 때문이다.
데이터 PM은 한 가지 숫자만 보고 맹목적으로 “데이터 기반의” 의사 결정을 하지 않는다. 그들은 적절하게 회의적인 데이터의 제작자이자 소비자이다.
데이터 PM은 데이터 과학자, 개발자, 디자이너, 마케터, 그리고 다른 PM들 간의 요구사항을 해석할 수 있다. 그들은 제품을 측정하고 그 데이터를 저장하는 부분을 제품 개발과정에서 빼먹지 않도록 하고, 데이터 과학자와 협력하여 가능한 한 빨리 분석 및 모델링에 데이터를 사용할 수 있도록 한다. 그들은 데이터 과학자에게 중요한 데이터가 무엇인지 가정하는 일을 개발자가 하도록 맡겨두지 않는다.
마지막으로 데이터 PM은 데이터, 모델, 결과가 전부가 아니라는 것을 안다. 그들은 여전히 PM이므로, 이러한 요소들을 비즈니스 모델과 조직의 전략으로 연결시킨다. 비즈니스 모델에 맞지 않는 머신러닝 모델은 시간과 돈 낭비일 뿐만 아니라, 조직이 머신러닝 기술을 불신하도록 만들 수 있다. 특히 데이터 과학에서 뒤처지거나, 데이터 과학의 힘에 대해 회의적이거나, 경영진이 정성적인 것만을 중시하는 회사에서 발생하기 쉬운 문제이다.
이러한 이유로, 난 여전히 좋은 데이터 과학자가 좋은 프로덕트 매니저를 만든다고 주장하면서도, 새로운 종류의 PM이 떠오르고 있다고 본다.
역자 후기
원문은 2017년 7월에 쓰인 글인데, 올라온 지 얼마 되지 않았을 때 처음 읽고, 이거다 싶었습니다. 전 직장에서 PM 역할을 하다가 어쩌다 보니 데이터 분석과 분석 환경 구축을 더 많이 하게 되어 혼란스러워하고 있던 저의 상황에 일종의 합리화를 할 수 있었는데요.
제품 기획에 데이터를 이용할 줄 알고, 직접 어느 정도의 분석을 할 수 있으면서, 제품이 어떤 데이터를 생산해야 할지, 생산된 데이터가 다시 제품의 개선에 어떻게 기여할지 생각할 줄 아는 PM은, 아직 그렇게 흔하지는 않지만 앞으로 꼭 필요한 PM이 아닐까요. 제가 쌓아온 경험과 가지고 있는 스킬, 관심 분야를 종합해 봤을 때, 앞으로 제가 그런 PM이 되면 좋겠다고 생각했습니다.
1년 반 정도 시간이 경과한 지금 다시 읽어보니, 설명이 부족한 부분도 있고, 구성이 알찬 글은 아닌 것 같지만, 저에게는 여전히 울림을 주는 글이라 한 번 번역을 해봤습니다.
이 글에서 말하는 데이터 PM은 주로 ‘Data’ PM, 즉 데이터에 대한 이해도를 PM 프로세스 전반에 활용할 수 있는 사람인데요, 저는 데이터 PM이 ‘Data Product’의 PM이 될 수도 있다고 봅니다. 주로 데이터 과학자나 분석가가 만들고 있는 data product를, business value와 제품 개발을 잘 이해하는 PM이 함께 만들었을 때 시너지 효과가 날 수 있다고 생각합니다.
아직 해외에서도, 국내에서도 이 영역이 제대로 define 되지는 않은 것 같습니다. 앞으로 이 분야에 대해 더 좋은 글을 제가 직접 쓸 수 있도록 노력하겠습니다. :)
참고로 부제목으로 적은 ‘모든 데이터 PM은 PM이지만, 모든 PM이 데이터 PM은 아니다'라는 얘기는 이 글에 나옵니다. 함께 읽어보셔도 좋을 것 같습니다.