brunch

You can make anything
by writing

C.S.Lewis

by 데이터리안 Jul 04. 2023

지표 설계부터 모델링까지 다 하는 1인 분석가 이야기

5년차 데이터 분석가 양현승님의 커리어 엿보기

얼마 전에 웹서핑하다가 스포카의 기술 블로그에서 데이터 분석가 양현승님께서 쓰신 ‘이벤트 로그 체계 구축 여정’이라는 글을 읽었습니다. 키친보드라는 서비스의 이벤트 로그를 새로 설계하게 된 과정을 자세한 예를 들어 설명해 주신 글이었는데요.

이전 회사에서 로그 설계 관련해서 공개된 정보나 참고할 만한 자료가 많지 않아서 어려움을 겪었던 기억이 있는데, 본인이 업무하면서 고민했던 것들과 실제로 적용한 로그들의 예시를 가감 없이 보여준 글을 보니까 너무 반가웠어요.


그런데 알고 보니 이 글을 쓴 양현승님께서 얼마 전에 저희 멤버들이 재미있게 읽었던 ‘데이터가 이끄는 성장, 1인 데이터 분석가의 이야기’ 글을 쓴 분이고, 또 심지어 저희 데이터 분석 캠프 수강생이라고 하시더라고요. 어떻게 이런 우연이 있을 수 있죠!


이런 재미있는 인연을 놓칠 수는 없겠죠. 데이터리안이 스포카의 프로덕트 분석가 양현승님을 만나봤습니다. 데이터 분석가와 데이터 사이언티스트 두 가지 직무로 모두 일해보신 현승님의 커리어 이야기가 궁금하시다면, 인터뷰 끝까지 읽어주세요.



스포카에 재직 중인 5년 차 데이터 분석가 양현승입니다

Q. 안녕하세요 현승님 자기소개 부탁드려요.

사모예드를 너무 좋아하는 5년 차 데이터 분석가 양현승입니다.

저는 현재 식자재 플랫폼 스포카에서 데이터 분석가로 활동하고 있습니다. 스포카는 세 번째 회사인데요. 첫 회사에서는 데이터 분석가로 일했고, 두 번째 회사에서는 데이터 사이언티스트로 일했고, 지금은 다시 데이터 분석가로 일하고 있어요. 이직한 지 6개월 되었습니다.


현승님이 쓰신 스포카 팀 블로그 글




식자재 유통 시장 50조, 디지털화를 꿈꿔요

Q. 스포카 하면 음식점 가서 포인트 적립하는 도도포인트를 먼저 떠올리게 되는데요. 22년에 야놀자에 도도포인트가 인수되었다는 뉴스 보도기사를 봤어요. 맞나요?

네, 맞습니다. 아직도 스포카 하면 도도포인트로 알고 계시는 분들이 많을 것 같은데요. 도도포인트는 야놀자에 매각하고, 키친보드라는 서비스로 피보팅했어요.


키친보드가 무슨 서비스인지 조금 더 설명을 해드리면요. 간단히 말하면 식자재 주문 관리를 한꺼번에 효율적으로 할 수 있게끔 만들어 주는 플랫폼이에요. 기존에는 식당이 식자재를 주문하기 위해서는 문자나 카톡으로 유통 업체에 일일이 주문해야만 했는데요. 그 과정을 디지털화해서 번거로움을 줄이고 좀 더 편리하고 효율적으로 관리할 수 있게끔 해주는 게 키친보드에서 제공하고 싶은 가치예요.


스마트 식자재 주문 관리 플랫폼 키친보드


Q. 아하 그래서 스포카를 소개하실 때 식자재 플랫폼이라고 이야기하셨던 거군요? 도도포인트밖에 몰랐던 저는 옛날 사람이었네요(웃음). 식자재 유통은 시장 자체가 꽤 클 것 같은데 어느 정도 규모인가요?

제가 알기로는 50조 정도의 시장이라고 알고 있어요. 그 정도로 시장 규모는 큰 데 비해서 대부분의 식자재 주문 및 관리가 문자, 카톡으로만 이루어지고 있기 때문에 스포카에서 디지털화를 해보려고 노력하고 있는 거고요. 다만, 허들이 조금 높긴 한 것 같아요.


Q. 50조라니 꽤 큰 시장이군요. 어떤 부분에서 허들이 높다고 느끼시나요?

저희가 하는 일이 오프라인으로 진행되고 파편화 되어있던 프로세스를 온라인으로 옮겨오는 일이라고 할 수 있거든요. 주문 및 관리하는 프로세스를 온라인으로 옮겨오는 것 그 자체로도 어려움이 있기도 하고요.

또 유통사분들이 기존에 쓰시고 있는 재고 관리나 유통, 운영을 도와주는 ERP라는 솔루션도 있거든요. 이 ERP가 해줄 수 있는 영역을 침범하지 않으면서 어떻게 우리만의 아이템을 만들 수 있을까 고민하는 부분도 어려운 부분이라 여러 방면으로 고민을 많이 하고 있어요.




로그 설계, 레퍼런스가 부족해서 직접 글을 썼어요

Q. 아하 고민이 많으시겠어요. 얼마 전에 현승님이 스포카 테크 블로그에 써주신 ‘이벤트 로그 체계 구축 여정’이라는 글 정말 재미있게 읽었는데요. 요즘은 스포카 데이터 분석가로서 어떤 일들을 하고 계신가요?

제가 이직한 지 이제 6개월 정도가 되었는데요. 키친보드 서비스로 피봇팅을 한 지는 시간이 조금 지나서 데이터가 쌓여있기는 하지만, 데이터 분석을 하기에 충분한 데이터가 있지는 않더라고요. 특히 사용자 행동 데이터(로그 데이터)가 부족해서 이번에 로그 설계를 직접 하게 되었습니다.



Q. 그러셨군요. 분석가들 로그 설계 많이 하는데, 로그 설계와 관련된 내용이 인터넷에 찾아봐도 많이 없잖아요. 그래서 현승님께서 써주신 글을 발견했을 때 되게 반갑더라고요. 제가 로그 설계 처음 할 때 되게 막막했던 게 새록새록 다시 기억나기도 하고요. 디테일한 예시를 보여주면서 왜, 어떻게 설계했는지 자세히 알려주셔서 실무에서 로그 설계하시는 분들은 이 글 보고 도움을 많이 받으실 것 같아요.

그렇게 생각하셨다니 영광이네요. 안 그래도 요즘 매일 팀 블로그에 연결된 GA를 보면서 글 조회수를 확인하고 있어요. 조회수가 많이 나와야 한다고 생각한 건 아니었지만 글을 올려놓고 나니 궁금하고 신경이 쓰이더라고요.


최근에 로그 설계 글 말고도 1인 데이터 분석가로서 일한 6개월간의 회고(‘데이터가 이끄는 성장, 1인 데이터 분석가의 이야기’)도 글로 작성해서 개인 블로그에 올렸는데요. 링크드인에서는 이 글이 반응이 더 좋더라고요. 좋아요가 50개 정도 달린 것 같아요.


저는 로그 설계 글이 더 실무자들에게 필요한 내용이라고 생각해서 이게 반응이 더 좋을거라고 생각했는데, 그게 아니라서 좀 의외라고 생각했어요. 그래도 뭐… 보민님께서 데이터리안 오픈카톡방에 제 글을 공유해 주셔서 그걸로 만족하긴 했습니다(웃음).


아, 그리고 이 글(‘이벤트 로그 체계 구축 여정’) 덕분에 재미있는 경험을 했는데요. 로그 설계 때문에 고민하고 계신 분이 글을 보고 궁금한 점이 몇 가지 있다고 하시면서 연락을 주셨더라고요. 그분과 이런저런 이야기를 나눠보았던 것도 꽤 재미있는 경험이었어요.


스타트업 데이터팀 6개월차 회고글


Q. 너무 재미있는 에피소드네요. 저는 로그 설계 글 너무 필요하고 귀한 글이라고 생각하는데요. 로그 설계 글은 링크드인보다는 오히려 로그 설계 어떻게 해야 할지 막막해서 검색해 보고 계시는 분들이 찾아서 보면 굉장히 반갑고 유용하다고 느낄만한 좋은 글인 것 같습니다. 링크드인 좋아요 수 때문에 너무 낙심하지는 않으셔도 될 것 같아요(웃음).

감사합니다. 정말 많은 힘이 되네요(웃음).




블로그 글쓰기는 업무를 위한 선순환을 만들어요

Q. 그럼, 블로그 이야기가 나온 김에 글쓰기 관련한 이야기를 조금만 더 해볼게요. 사내 유일한 데이터 분석가라면 본인 업무를 하는 것만으로도 아주 바쁘실텐데 시간 내서 블로그 글을 쓰시는 이유가 따로 있으신가요?

글을 쓰기 위해서는 내가 어떤 걸 하는 과정에서 무엇을 했는지 무엇을 느꼈는지 정리를 해야 하는데요. 그래서인지 글을 쓰다 보면 여러모로 생각 정리가 되기도 하고요. 글을 쓰고 난 후에 다시 일을 해야 하잖아요. 이렇게 글을 쓰고 다시 일로 돌아왔을 때, 글 쓰면서 생각했던 부분들을 조금 더 고민하면서 일하게 되는 것 같아요. 업무를 위한 선순환이 된다고 해야 할까요?


그 외에도 요즘은 자기 PR의 시대이기도 하니까요. 제 스스로를 브랜딩하는 데에 있어서도 글쓰기는 중요하다고 생각했어요.



Q. 스포카 테크 블로그에 알차고 좋은 글이 많기로 유명하잖아요. 사내 문화도 좀 궁금하더라고요. 혹시 스포카에서는 회사 차원에서 블로그 글 쓰는 걸 장려하나요?

네, 스포카에서는 항상 기술 블로그 쓰라고 권장을 많이 해주세요. 덕분에 꽤 많은 개발자분이 열심히 글을 쓰고 계시고요. 글을 쓰면 서로 피드백해 주고 축하해주는 분위기라서 글쓰기 자체는 굉장히 장려되는 분위기인데요. 하지만 아무래도 회사 공식 블로그에 글을 올리는 것이다 보니 조금은 부담이 되기는 합니다.


이번에 작성한 이벤트 로그 설계 글도 회사의 데이터와 관련된 내용이다 보니 경영진 분들께 미리 허락을 받아야 했거든요. 내부에 들어가는 데이터도 모두 실제 데이터와 조금 다른 예시 데이터를 넣어야 했고요. 글 쓰는 것보다 예시 데이터 만들고 넣는데 시간이 좀 더 걸리기는 했는데요. 그래도 이 내용으로 글을 써도 된다고 허락해 주신 게 감사했어요.


이벤트 로그 설계 예시 데이터




프로덕트 데이터 분석, 모델링 둘 다 하면 두 배로 재밌지 않을까요

Q. 그러네요. 생각해 보니까 로그 설계 관련한 내용이 블로그 글로 많이 쓰여지지 않았던 게 데이터가 외부로 노출되는 부분이 너무 민감해서일지도 모르겠다는 생각이 들기도 해요. 경영진분들께서 흔쾌히 허락해 주신 게 정말 다행입니다.

그럼, 지금까지 스포카 현재 직장인 스포카에 대해서 한참 이야기를 해보았는데요. 이전 직장에서는 어떤 일들을 해보셨는지도 이야기를 조금 듣고 싶어요.


첫 직장은 SI 업체였습니다. 데이터 분석가로 입사했고요. SI 업체라서 하나의 프로덕트를 꾸준히 분석한다기보다는 이것저것 여러 가지 프로젝트를 맡아서 분석했었고요. 지금 생각나는 프로젝트는 주류 시장 분석 프로젝트, 공기업에서 했던 에너지 관리 시스템 프로젝트 같은 것들이네요.


두 번째 직장은 애드테크 회사였는데요. 여기서는 데이터 사이언티스트로 일을 했었습니다. 제가 담당했던 업무는 총 두 가지였어요. 첫 번째는 네이버 스마트 스토어에 사람들이 상품을 올리면 특정 키워드를 입력했을 때 나오는 상품 랭킹을 예측하고, 내 상품의 등수는 몇 등일까를 예측해 주는 모델을 개발하는 일이었고요. 두 번째는 해외에서 K-beauty 상품들이 얼마나 반응이 좋을지 리뷰 데이터를 기반으로 감성 분석을 하는 일이었습니다.


그러다가 이제 세 번째 직장 스포카로 이직해서 지금은 프로덕트 분석가로 일을 하고 있고요. 여기서도 모델링도 하고는 있어요.



Q. 돌고 돌아 다시 지금 업무 이야기로 돌아왔네요. 데이터 사이언티스트로 일하시다가 다시 프로덕트 분석을 해야겠다고 생각한 이유가 있으신가요?

데이터리안 SQL 강의에서도 이야기를 해주시지만, SQL을 잘 쓰면 생각보다 할 수 있는 일들이 굉장히 많아요.


제가 데이터 사이언티스트로 일할 때를 생각해 보면, 그때는 제가 DB에서 데이터를 직접 뽑아서 분석하는 게 아니라 누군가 뽑아주는 데이터를 가지고 모델링만 제가 했었는데요. 그런데 SQL로 직접 데이터를 뽑아볼 수 있는 능력이 있으면, 사용자들이 실제로 어디서 어떻게 행동하는 지 제가 데이터를 직접 뽑아보면서 모델링만 할 때는 몰랐던 피쳐를 발견할 수도 있는 것 같더라고요. 모델링만 할 때보다 더 다양한 일들을 해볼 수 있다고 해야 할까요?


이걸 말로 설명하려니 조금 어려운데요(웃음). 제품을 좀 더 능동적으로 뜯어볼 수 있는 역할이 프로덕트 분석가라고 생각했던 것 같아요. 그래서 제품을 직접 분석할 수 있으면 모델링도 더 재미있게 할 수 있겠다 싶어서 프로덕트 분석가로 다시 일을 하게 되었습니다.


약간 욕심쟁이인 것 같아요. 프로덕트 분석이나 모델링 둘 다 재미있게 잘하고 싶어요.




더 효율적으로 일하기 위해 동료들과 데이터를 함께 봅니다

Q. 욕심쟁이가 맞으신 것 같기도 하네요(웃음). 농담입니다. 근데 지금 사내 1인 분석가로 일하고 계시다고 알고 있는데요. 로그 설계도 하고 분석도 하고 모델링까지 하시는 거면 몸이 두 개라도 모자라시겠어요. 이런 환경에서 인사이트 내기 어렵지 않으신가요?

앗.. 네, 요즘에는 모든 팀들이 매출을 발생시키기 위해 집중해서 작업을 하고 있는데요. 그 와중에 제 역할이 중요해졌어요. 프로덕트 분석 관점에서는 CAC도 낮추고, LTV 높이고 해야하는데, 그러기 위해서 어떤 데이터들을 봐야 하는지 제안을 해야해요. 또 모델링 관점에서는 고객 만족도를 높이기 위해서는 어떤 분석, 어떤 모델이 필요한지 고민해 봐야 하는 상황이고요. 고객을 락인(Lock-in) 시킬 수 있을 만한 새로운 인사이트, 새로운 아이디어가 있는지 항상 고민해야하는 상황인데요.


말씀해 주신 것처럼 분석가가 저 혼자이다 보니까 병목이 생길 수밖에 없어요. 그래서 저는 이 문제를 해결하기 위해서 동료들에게 모든 데이터를 공개했습니다. 원래 데이터 팀만 보던 대시보드, 제가 따로 모니터링하던 대시보드 같은 것들을 모두 접근할 수 있게 공개했고요. 사람들이 공개된 데이터들을 잘 검색하고 필터할 수 있게끔 세팅했어요. 그러니까 저한테 오는 단순 데이터 추출 요청 같은 건 많이 줄어들었는데요. 대신 이제 데이터를 보시다가 좀 더 궁금한 점, 좀 더 알고 싶은 데이터가 있으면 저를 찾아오시기는 하더라고요.


또 한편으로는 자동화를 많이 하기도 했는데요. 로그도 설계하고 심으면 끝인 게 아니라 제대로 데이터가 나오고 있는지 검증해 봐야 하잖아요. 이 과정이 또 엄청 험난한데요. 이런 검증 같은 것도 최대한 대시보드로 자동화해서 분석가가 확인해 봐야 하는 로그, 개발자분들이 확인해 봐야 하는 로그를 나눌 수 있게끔 했습니다. 개발자분들이 확인해주셔야하는 로그는 개발자분들께 자동으로 확인 요청이 가게끔 만들었어요. 이렇게 하고 나니까 로그 검증하는 데에 드는 시간이 1/10로 줄더라고요. 그것만 해도 저는 리소스를 최대한 효율적으로 쓸 수 있게 된 것 같습니다.


개인 블로그에 담겨있는 분석 요청 프로세스 개선 과정




데이터 분석 캠프 5년 차 데이터 분석가도 만족했어요

Q. 우와.. 로그 검증 자동화를 하셨다니 대단한걸요! 이쯤 되니 현승님 정말 대단한 분이다 싶기도 하면서, 한편으로는 이렇게 스스로 할 줄 아는 게 많은 분이 어쩌다가 데이터리안 강의를 듣게 되신건지 궁금해지는데요(웃음).

어쩌다가 데이터리안을 알게 되셨는지, 데이터 분석 캠프는 왜 듣기로 결심하셨는지 이야기 해주실 수 있을까요?

사실 회사에서 분석가가 저 혼자라서 살려고 했던 일들인데요(웃음). 그렇게 이야기 해주시니 아주 영광입니다.


두 번째 회사에서 데이터 사이언티스트로 일할 때 공공 데이터를 수집해서 MySQL에 적재하는 업무를 잠깐 맡은 적이 있었는데요. 그 일을 하면서 데이터를 수집하고 적재하기 위한 SQL 문법을 익혔습니다. 그때 SQL 자격증도 땄는데요. 막상 자격증까지 땄는데도, 제가 배운 SQL 문법들이 다른 회사에서 데이터 분석가들이 사용하는 SQL 문법과는 좀 다른 것 같더라고요. 저는 어쨌거나 데이터 분석을 앞으로도 계속하고 싶은 거니까 데이터 분석에 사용되는 SQL을 배우고 싶다는 생각했습니다.


그래서 그때부터 관련 내용들을 많이 찾아보고 강의도 여러 개 봤었고요. 혼자 리트코드 같은 플랫폼에서 SQL 문제를 풀어보기도 했습니다. 그런데 어떻게 공부해도 이걸 막상 실무에 적용하라고 할 때, 어떻게 해야 할지 모르겠고 막막한 건 마찬가지더라고요.


그런 고민을 하던 와중에 데이터리안 SQL 데이터 분석 캠프를 알게 되었는데요. 강사진이 모두 현업에서 데이터 분석을 해보셨던 분들이라고 해서 ‘여기서 하는 교육은 뭔가 좀 다르지 않을까?’하는 생각이 들었어요. 그러다가 웹사이트에 있는 블로그를 들어가서 글을 읽어봤는데 내용이 너무 좋은거예요. 짧은데 내용이 탄탄했거든요. 또 유튜브가 있다길래 영상을 봤는데요. 영상은 더 유익하고 더 좋은 거죠. 그래서 바로 캠프를 등록했어요.


실제로 캠프를 들어보고 나서 정말 만족했고요. 너무 재밌었어요. 실무자 입장에서 데이터 분석에 필요한 SQL 문법을 알려주시는 것도 그렇고요. 매월 진행하는 데이터 분석 세미나도 무료로 들을 수 있잖아요. 세미나에서 제가 전혀 경험하지 못했던 데이터 분석과 관련된 이야기들을 간접적으로 들어볼 수 있어서 그것도 너무 좋았어요. 세미나에서 들었던 내용들을 실무에서 어떻게 적용해 보면 좋을까 고민해 보기도 했고요.


현업 분석가 출신 데이터 분석가 멘토



Q. 너무 좋네요. 오늘 인터뷰 진행하기 전에 현승님께서 5년 차 데이터 분석가라는 정보를 알고 들어왔는데요. 5년 차 데이터 분석가가 저희 캠프에서 배울만한 게 있었을까 하는 걱정을 좀 했는데, 캠프 들어보시고 굉장히 만족하셨고 또 세미나도 도움이 되셨다고 하니까 아주 뿌듯합니다. GA4 데이터 분석 캠프는 어떠셨어요?

일단 저는 SQL 캠프가 너무 좋아서 다음에 어떤 강의가 나와도 들을 생각이 있었는데요. 마침 GA4 데이터 분석 캠프가 새로 나왔더라고요. 일단 재밌겠다 싶어서 냅다 등록을 해봤고요.


저는 GA4 캠프를 듣기 전까지는 구글 애널리틱스를 한 번도 안 써봤었거든요. 이번에 GA4 데이터 분석 캠프를 들으면서 티스토리 블로그를 만들고 직접 GA 연결해서 이벤트 설정하는 실습을 처음 해봤는데요. 데이터가 실시간으로 찍히는 걸 보니까 너무 재밌더라고요. 누가 글을 50%까지만 읽고 나가나 이런 것들이 실시간으로 눈에 보이잖아요. 물론 데이터가 많진 않지만요.


현재 회사에서는 GA4를 많이 활용하고 있지는 못한데요. GA4 데이터 분석 캠프에서 배운 것들이 로그 설계에 도움이 많이 된 것 같아요. 특히 구글 태그 매니저(GTM)을 이용해서 이벤트를 잡는 방법을 실습해 볼 수 있었던 게 로그 설계할 때도 도움이 되었네요.



Q. 어떤 강의가 나와도 들으실 생각이셨다니 너무 감동인걸요. 이제 인터뷰를 마무리할 시간이 되었는데요. 마지막으로 데이터리안에 해주고 싶은 한마디가 있으신가요?

데이터리안 캠프는 데이터 분석가들에게 정말 도움이 많이 되는 것 같아요. 특히 사수가 없는 데이터 분석가들에게 정말 도움이 많이 되는 것 같은데요. 저처럼 혼자 공부했던 분들, 아니면 제대로 데이터 분석에 필요한 SQL을 배울 기회가 없었던 분들께 진짜 최고라고 말씀드리고 싶어요. 진짜로 그렇게 느껴서 주변에도 많이 이야기하고 다녔네요.


데이터리안 캠프를 들은 이후에 모교에서 강연할 기회가 있었는데요. 강연에서도 데이터리안을 추천했어요. 현업에서 분석하려면 SQL은 필수고, 데이터 분석을 위한 SQL을 제대로 배우려면 데이터리안 이라는 곳에서 배우는 게 좋다고 이야기를 해주기도 했어요.


사실 저는 오늘 인터뷰를 하게 된 것도 매우 영광스러웠고요. 다음 강의 소식을 기다리고 있겠습니다(웃음).






5년차 데이터 분석가 양현승님이 직접 알려주는 취업 & 커리어 가이드가 궁금하시다면,

월간 데이터리안 7월 세미나 만나요!


1부. 원맨팀 데이터 분석가의 고군분투기 _ 스포카 데이터 분석가 양현승

2부. 현직 데이터 분석가가 말하는 취업 & 커리어 가이드 _ 현직 데이터 분석가 4인 패널토크


↓ 아래 링크에서 지금 바로 신청할 수 있어요 (7/10 월요일 신청 마감)


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari