데이터 분석가로서의 삶
「 대리님 더보기 탭에서 각각 버튼들 클릭률 좀 뽑아주세요 」
「 전부요? 」
「 네 」
「 기간은요? 」
「 어.. 이번에 페이스북 광고 돌리기 전후로 한 보름쯤 비교하면 될 것 같아요 」
「 운영체제별로 가를 까요?」
「 네 연령대별로도 갈라주시면 좋고요 」
여느 회사에서 데이터 분석가, 데이터 담당자, 데이터 사이언티스트, 그로스 해커 등 여러 가지의 이름으로 불리는 사람들이 일상적으로 듣는 대화이다.
엄밀히 따지면, 데이터 분석가 (Data Analyst), 데이터 과학자 (Data Scientist), 그로스 해커 (Growth Hacker), 데이터 엔지니어 (Data Engineer) 모두 조직 내에서 담당하는 바가 크고 작게 다르며, 전공이나 특, 장점 또한 다르다. 데이터 기반 의사결정 (DDD - Data Driven DecisionMaking)을 수행하는 고도화된 데이터 인프라를 구축한 회사에서는 (사실 거기까지 갈 필요도 없긴 하다) 각각의 데이터 담당자들에게 다른 R&R를 부여하고, 각기 다른 퍼포먼스를 수행한다. 굉장히 주관적인 각각의 정의는 이러하다.
Data Analyst - 기존의 각각의 서비스 내 기능들의 퍼포먼스를 확인하고 고객의 불편함을 찾아 새로운 기능을 제안하고, 주요 단일 지표 (OMTM - One Metrics That Matters)를 발굴 및 관리하며, 서비스에 대한 사용자 행동 분석을 통해 리포트를 작성하고 사내에 공유하여, 서비스의 진행사항을 사내&외로 전달하는 역할. 공학도의 계산적인 감각도 필요하나, 정성적인 데이터에서의 사용자의 행동심리 또한 관철하는 감성 공돌이의 역할.
필요 스킬 : SQL, HTML5, CSS, Android, iOS, Tableau, Excel, Python, Statistics, Communication
Data Scientist - 기존 사용자들이 남긴 흔적 (Log)를 통해, 사용자 군을 구분(Segment)하고 각각의 세그먼트가 공통적으로 보이는 행동 양상을 파악하며 앞으로의 상황을 예측하는 모델링을 통해 서비스의 기획과 개선 그리고 개인화까지 이르는 역할을 수행한다. 데이터 분석가에 비해 정량적인 데이터를 통한 분석에 전문화되어 있다. 이커머스에서의 상품 노출 로직, 핀테크에서 카드 추천 등이 있다.
필요 스킬 : SQL, Programming (Python - Pandas, Numpy...), Statistics, mathematics
Data Engineer - 위의 두 직군에서 각각의 업무를 하기 위해 필요한 데이터 인프라를 구축해주는 역할. 산개되어 있는 데이터를 마트 화하여 일원화하고, 전 처리하며, 대용량 데이터베이스로 더 빠른 데이터 접근을 위한 클렌징, 데이터 분류 및 적재를 담당하는 파이프라인 구축 등의 업무를 수행한다. SQL를 다룸에 있어서 백엔드 개발자와 비슷해 보이나, 데이터를 다루는 시각이 다르기 때문에 세부 업무내역이 다소 상이할 수 있다.
필요 스킬 : SQL, Python, AWS, Java, Scala, Kotlin, GCP, Hive, Spark, Hadoop
그로스 해커는 그로스 해킹을 하는 사람 (Growth hack - er) 일 테니, 단연 사람이어야 할 텐데, 그로스 해커가 되고 싶다는 사람은 보았지만, 실제 그로스 해커를 본 적은 없는 것 같다. 여러 아티클 등에서 그로스 해커는 종종 모든 것들 전부 아우르는 팔이 열개쯤 달린 슈퍼맨으로 희화화하여 표현하곤 한다. 그도 그럴 것이, 나열된 필요한 스킬이나 주요 업무 내역을 보면 정말로 슈퍼맨까지는 아니어도, 스파이더맨 정도는 돼야 가능할 것 같다. 그를 통해 나름의 정의&정리를 해본 것이, 위의 사람들이 (혹은 마케팅, 기획자 모두를 포함) 모여 함께 추구하는 것이 Growth Hacking 일 뿐, 그로스 해커라는 한 사람이 그런 업무들을 모두 진행하기는 현실적으로 조금은 어려워 보인다. (추후 언젠가에는 그 시점에 당도하게 될지도 모르겠다)
(Data engineer를 구인한다고 써놓고 내용이 Data analyst 라거나 Scientist 라면, 직무에 대한 구분이 어렵고 (= 담당자가 없고), 다른 회사들이 다들 뽑는 것 같으니 우리도 뽑아야 할 것 같다 (=와서 다해줬으면 좋겠고).. 의 취지일 확률이 0.00001% 정도 있다고 보일 수 있겠다.)
(https://www.hendriklennarz.com/en/blog/what-the-fk-is-growth-hacking-2/)
각설하고, 결국 저들이 공통적으로 회사에 기여하게 되는 업무의 내용이 무엇일까? 아마도 숫자들과 영어가 혼재되어 있는 복잡한 데이터베이스 속에서 유의미한 무언가를 끄집어내서 예쁘게 닦고, 정리해서 인간이 읽을 수 있는 형태로 바꾸는 일(Human Readable)을 한다. 예를 들면 이렇다.
「 저희 MAU가 전월대비 25% 상승했습니다. 」
「 저희 MAU가 전월대비 25% 상승했으나, Return visitor대비 New visitor의 상승분이 더 높은 것으로 보아, 신규 인입이 많았던 것으로 확인되며 당월 신규로 인입된 사용자들은 페이스북, 구글, 네이버 블로그 순으로 인입되었습니다. 전월 대비 페이스북의 광고 효율 (단가)가 개선되었으며, 사용자에게 효과적인 광고 콘텐츠로 잘 접근하였기 때문이라 판단됩니다. 성공사례들을 잘 정리하여, 다시금 실험을 통해 잠재적 사용자를 이해할 수 있게 되면 좋겠습니다. 」
생각나는 대로 막 던진 예시이긴 하지만 단순히 설명의 길이뿐만 아니라, 수치화된 최종 결론을 조금 더 드릴 다운하여 원인을 파악하고, 향후 기피 내지는 추구해야 할 러닝 포인트도 확인하였다. 더 줄여 쓰자면, 보고서를 받아보고,
「아... 네.. 」
(= Good to know )
「음... 그래서요?」
(= So what... )
가 되면 안 된다는 말이다. 단순히 상승분이 궁금했다면, 구글 애널리틱스 같은 트랙킹 툴 권한만 요청해서 들어가도 보이는 것이니 사실 기대했던 피 보고자 입장에서는 실망을 금치 못할 것 같다. 숫자로 그득한 리포트는 당연히 글로 풀어쓴 것에 비해 전달력이 떨어지기 마련이다. 차트를 포함하면 조금은 더 예뻐지겠지만 여전히 그 숫자들이 의미하는 바를 단박에 이해하기는 조금 어렵다. 그렇기 때문에 숫자만 그득한 차트 (Raw Data)는 리포트 내에 포함은 시키되, 정리된 시트를 일반적으로 공유한다. 나름의 정리를 해보면,
목적 :
"매진이라 쓰여있는데도, 사용자들이 왜 상세페이지에 들어오는 걸까"에 대한 궁금증 해결
대상 :
2020년 7월 1일부터 최근 적재 데이터까지 (3~4Q)
가설 :
클릭 미스
혹시 그새 입고되었을까 봐
입증 :
클릭 미스 - 상세페이지 진입 후 화면 이탈까지의 소요시간 측정 (다른 상세 화면의 평균 시간과의 비교)
재입고 - 상세 페이지 진입 후 새로고침 유무 내지는 횟수
결과 :
매진 상품의 상세페이지에서의 이탈까지의 소요시간은 상대적으로 다른 상품들에 비해서 짧아 보이긴 하였으나, 그 때문이라고 판단하기에는 신뢰도가 부족하다. (보류)
매진 상품의 상세페이지에서 화면을 이탈하지 않고 지속적으로 페이지뷰를 일으키며 (=새로고침) 반복적으로 해당 상품의 입고여부를 확인하려는 사용자의 행동이 파악됨 (입증)
플랜 :
로그인한 사용자가 품절 상품에서 반복적인 새로고침 내지는 장기 체류하는 경우, 해당 상품의 재입고를 기다리고 있는 것으로 간주하고, 재입고 시 푸시나 SMS 등으로 알려주고 구매할 수 있도록 한다.
의식의 흐름대로 흩날린 내용이긴 하지만, 대략적인 포맷을 위처럼 가져가려고 노력한다. 데이터 검증의 목적을 제시하고, 추출할 데이터의 정의를 한 다음에, 가설을 수립하고, 해당 가설들의 진위여부(?)를 확인 후, 결론을 도출시킨 후 결과적으로는 어찌어찌 하자는 계획 (=Action item)을 공유하는 것이다.
그렇다. 사내에서 데이터 담당자로 근무하다 보면, 최상단의 대화처럼 "데이터 자판기" 같은 업무를 수행하게 된다. 물론 해당 업무의 중요도를 논하자는 것은 아니나, 적어도 그 일이 '분석'의 범주는 아닌 것 같다. 사실 데이터 추출의 업무야 분석가가 아니라, ERD(Entity Relationshop Diagram) 보고 쿼리 날릴 수 있는 컴공 학부생만 되어도 할 수 있는 일 아닌가. 데이터를 그렇게 핸들링하는 것으로 스스로를 분석가다 과학자다 라고 말하기에는 조금 부족함이 없지 않나 라는 생각이 든다. 자판기의 업무를 어쩔 수 없이 수행하는 것은 피할 수 없으나 단순히 요청한 숫자들을 엑셀에 주욱 담아서 전달하기보다는, 추출의 목적에 대해 확인하고 숫자뿐인 엑셀 파일에 최소 차트라도 삽입시켜서 정리를 조금 해서 전달해본다면 그리고 금상첨화로 인사이트를 추출해서 조금 적어서 공유해 준다면 조금은 더 분석가스러운 업무를 할 수 있게 되지 않을까 조심스럽게 생각해 본다.
데이터 분석가가 소개팅에 나가서 뭐하는 사람인지 1시간씩 설명하지 않아도 되는 시대가 올 때까지 해당 업무에 대한 분석 사례와 업무 내용에 대해 정리해보겠다.