brunch

매거진 회사일지

You can make anything
by writing

C.S.Lewis

by 여름비 Feb 18. 2024

회고3: 그래서 님이 데이터 분석가로서 뭘 했는데요?

데이터 분석가로서 내가 했다고 자랑스럽게 말할 수 있는 것들

그래서 나는 데이터 분석가였던 시절, 4년 반 동안, 두 회사에서 무엇을 하였는가?

정멀로 회사에 가치를 줄 수 있는 무언가를 했는가?


이 두 질문은 싸늘하게 나의 폐부를 찌른다. (아냐, 한 거 많다고!)


데이터 분석가로서 경력에 내세울만한 프로젝트를 하기는 쉽지 않다. 왜냐하면, 사실 대부분의 업무들이 다른 사람이 건네어오는 단순한 질문들에 대한 답을 데이터로 찾는 일 이기 때문이다. 그렇기에 나 또한 돌이켜보면 내 이력서에 쓸만한 대부분의 프로젝트들은 내가 집적 나서서 하겠다고 한 프로젝트들이었다.  


이는 다시 말하면, 내가 이력에 채워 넣은 프로젝트들이 바로 내가 지향하는 가치를 대변한다고도 볼 수 있다.

그렇다면 나는 어떤 프로젝트들을 데이터 분석가로서 진행했고 왜 그 프로젝트들을 하기로 결심했던 것일까?


이전에 내가 데이터 분석가이던 시절 작성했던 '데이터 분석가 이력서'를 돌이켜보며 하나하나 작성해 본다.



1. 모두의, 모두에 의한, 모두를 위한 데이터 활용
[ Amplitude 도입 & 데이터 탁소노미 리뉴얼 ]


이전 글에서 설명한 것과 같이, 나는 분석과 그에 기반한 실행 사이의 물리적, 시간적, 회사 구조적 거리가 작으면 작을수록 좋다고 생각했다. 그렇기에 나는 데이터 분석가가 궁극적으로 목표해야 하는 것은, 회사의 모든 사람들이 데이터 분석가 도움 없이 스스로 데이터를 분석할 수 있는 환경과 실력을 갖추는 것이라 생각했다. 그리고 이런 데이터 분석하기 좋은 환경과 구성원들의 분석 실력향상을 위해서는 아래와 같은 것이 필수적이라 생각했다


- 누구나 이해하고 설계하기 쉬운 데이터 형식 및 이름

- 누구나 쉽게 데이터를 조회하고 분석할 수 있는 도구의 도입 및 교육 

- 데이터를 활용해 서비스를 성공시켜 보는 경험


이런 생각을 가지고 있다 보니, 스스로 내 프로젝트를 결정하기 시작했던 첫 위사에서의 마지막 해에, 나는 Amplitude라는 누구나 데이터를 분석할 수 있도록 도와주는 소프트웨어의 전사적 도입을 도맡아 했고, 이미 그 수명을 다해 모두가 이해하기 어려워하던 기존의 데이터 탁소노미를 (유저 행동 데이터의 이름 몇 이름 형식) 리뉴얼하기로 결심했다.


잘한 점은, 더 이상 데이터 분석가를 추가로 고용하지 않아도 되게 환경을 세팅하였다는 것이고, 못한 점은 내가 온전히 리드가 되어 프로젝트를 진행하는 것이 처음이다 보니 생각보다 더 느리게 프로젝트가 진척되었다는 것이다. 여기에 더해서, 회사의 각 PM들이 데이터를 활용하는 스타일과, 데이터 활용 자체에 대한 생각이 어땠는지 인터뷰를 하고 이를 기반으로 프로젝트 진행 단계를 설계했으면 훨씬 더 좋은 결과가 만들어졌지 않았을까 라는 생각이 든다.


역시, 어떤 프로젝트든, 해당 프로젝트가 가치를 전달하고자 하는 고객이 무엇을 불편해하고 또 원하는지 알아야만 성공적인 프로젝트가 되는 것 같다


2. 구조적 이해는 훌륭한 지표로부터 나온다
[ 서비스 지표 설계 & 지표 데이터 마트 만들기 ]

많은 사람들이 실리콘벨리의 케이스들, 혹은 토스를 보면서 서비스 성공을 위해서는 실험을 해야 한다고 생각한다. 그리고 그 실험을 통해 지표를 끊임없이 향상하는 작업을 해야 한다고 생각한다. 그런데, 여기서 조금 되짚어볼 만한 부분이 있다. 그래서 지표가 뭔데?


리텐션, DAU 등의 다양한 지표들이 있지만 결국 깊게 파고들어 가 보면 지표란 고객들이 우리의 서비스를 어떻게 사용하는지에 대한 측정이다. 그리고 이 지표들의 목표 수치는 '우리 서비스가 성공했을 때 유저들이 우리 서비스를 어떻게 얼마나 사용할고 있을까'에 대한 상상이다.


그렇기에, 훌륭한 지표를 만든다는 것은 고객의 서비스 내 행동에 대한 구조적 이해이자 서비스가 어떤 방향으로 나아가야 하는가에 대한 확신이다.


이런 생각 때문일까, 내가 두 번째 회사에서 했던 자발적 프로젝트 중 하나는 앱 서비스의 지표를 설계하고, 이 지표를 누구나 쉽게 찾아보고 또 이해할 수 있도록 지표 데이터 마트를 만든 것이다.


이 프로젝트를 시작하게 된 계기는 간단하다. 다양한 사람들이 다양한 지표들이 계속 만들다 보니 시시때때로 지표들의 측정 방식이 달라지고,  또 매번 이전에 구했던 지표를 다시 구하는 비효율성이 증가하고 있었기 때문이다. 이런 문제로 인해 고객 행동에 대한 구조적 이해가 사람마다 달라지는, 더 나아가 그래서 내가 보는 지표가 정말로 믿을만하고 또 모두 동의하는 지표인지 알 수 없게 되어버리는 케이스가 점점 더 많아지고 있었다.  그러다 보니 우리 모두가 합의한 각 지표의 정의가 필요하다고 생각했고, 그렇게 정의한 지표들의 수치를 모아놓은 누구나 믿을 수 있는 지표 데이터 마트가 필요하다고 생각해서 진행한 프로젝트였다.


이 프로젝트는 생각보다 많은 시간이 걸렸었다.  '그래서 우리 서비스에서 중요한 지표가 뭐고 또 왜 그렇게 측정해야 하는데?'에 대한 대답을 다양한 사람들과 이야기해 나아가며 찾아야 했고, 또 그렇게 정한 지표들을 누구나 사용할 수 있는 방식으로 데이터 마트를 만들고 가다듬는데 여러 시행착오를 겪어내야 했다.





3. 정확하고 상세한 데이터는 데이터 활용 알파이자 오메가이다
[ 유저 아이디 복구 수학 알고리즘 만들기 ]



사실, 모든 데이터 분석 방법론 이전에 데이터가 없다면 모든 것이 무용지물이다. 데이터를 다루다 보면 정확하고 상세한 데이터란 세상에 존재하지 않고 끊임없는 데이터 유지보수와 간접적 추론이 필수라는 것을 알게 된다. 그리고 그런 데이터 유지보수 및 추론의 끝판왕을 한번 해보게 되는데, 그것은 바로 수학적 알고리즘을 통한 유저 행동데이터의 유저 아이디를 복구하는 작업이었다.


첫 회사의 앱 서비스는 타사의 상품정보를 모아서 비교해 주는 플랫폼이다 보니, 실제로 해당 상품을 구매하기 위해서는 해당 상품을 판매하는 서비스로 넘어가서 구매가 이루어졌다. 그렇기에, 여러 가지 방법을 통해 해당 유저가 타사 웹사이트로 넘어간 후 하는 행동들을 따로 데이터로 쌓고 있었는데, 문제는 그런 데이터에 유저 아이디가 붙어있지 않은 경우가 굉장히 많았다는 것이다. 이러다 보니, 구매전환율에 대한 측정을 추론할 수 밖이 없었다. 


이런 상황을 타파하고자, 유저의 ip 및 agent, 디바이스 아이디 등을 통해서 유저의 아이디를 추론하는 알고리즘을 작성하기로 하였고, 놀랍게도 이를 통해 전체 타사 유저행동 데이터중 적어도 20% 이상에 대해 유저 아이디를 복구할 수 있었다.


지금 생각해 봐도 어떻게 '그래프이론을 활용한 비지도 학습'이라는 논문을 찾아서 그 안에 있는 수학적 알고리즘의 일부를 적용시킬 생각을 했는지 나도 신기하다.



4. 이 모든 데이터 프로젝트의 끝판왕
[ 내 손으로 데이터 환경 처음부터 만들어보기 ]



데이터 분석가로서의 커리어 끝판왕은 무엇일까? 

바로 내가 처음부터 끝가지 데이터 분석 환경을 설계하고 만드는 것이다 (프로그래밍은 다른 사람이 하하)

3번째 회사에서 Data Product Manager로서 이것을 한번 해봤는데 너무너무너무 어려웠던 기억이 난다. 

이에  대해서는 다른 글에서 상세히 다루어보도록 하겠다.



다음 글에서 계.... 속!!


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari