brunch

You can make anything
by writing

C.S.Lewis

by Carmen Mar 23. 2018

데이터 사이언스 신입사원

입사 후 두 달

2017년 12월 대학원 졸업 후 노스캐롤라이나에서 보스톤으로 이사온지, 그리고 미국에서 첫번째 회사에 입사한지 두 달 정도 흘렀다.


같은 회사, 같은 도시에서 인턴으로 일했던터라 완전히 낯설지는 않았지만, 돌아갈 학교와 도시가 있었던 작년과 달리 ‘정착’과 ‘정규직’은 더 근본적인 적응이 필요했다. 한국 직딩에서 미국 대학원생으로 트랜스폼 하는 수준의 적응.



내가 하는 일 - 이커머스

인턴 때와 지금 가장 다른 점은 데이터 사이언스를 적용하는 분야인데, 인턴 때 피트니스 모바일 앱과 관련된 일을 했던 반면 지금은 글로벌 스포츠 브랜드인 모기업의 이커머스 사업을 위해 일하고 있다.


내가 하는 일은 크게 두 가지로 나눠진다. 하나는 이커머스 사이트의 매출을 높이기 위한 최적화, 개인화이다. 이커머스는 기업이 건드릴 수 있는 거의 모든 밸류 체인을 건드리는만큼 사이트 유입을 위한 마케팅부터 사이트 내 경험, 물류와 배송까지 최적화 할 영역이 매우 다양하다. 데이터 사이언스는 어느 부분에, 어떤 변화가, 왜 필요한지 (즉 얼마나 더 많은 수익이 창출될 수 있을지?)를 분석, 예측하고 이미 존재하는 기능이나 사이트 내 요소(예: ‘장바구니 담기’ 버튼의 크기, 컬러, 위치) 를 평가한다. 개인화는 넷플릭스, 아마존의 상품 추천이 가장 좋은 예인데 누구에게, 언제, 어떤 상품을, 어느 위치에서 추천해야 가장 효율적일지 결정하는 모델을 만들고 적용하고 제 역할을 하는지 모니터링하는 것이 주 업무다.


또 하나의 일은 옴니 채널 구축이다. 이커머스 사이트, 오프라인 공식 매장, 기타 다른 채널에서 소비자/유저들이 일관된, 그리고 효율적인 경험을 제공하는 것이 옴니 채널이라면 데이터 사이언스는 그것을 가능하도록 고객과 고객여정(customer journey)을 파악, 예측하고 고객과 장기적인 관계를 유지하기 위한 전략, 전술을 지원한다. 예를 들면 할인 혜택을 어떤 고객들에게 우선적으로 주어야 가장 효율적일지(비용 대비 매출이 높을지), 어떤 고객 그룹의 이탈율이 높을지 예측한다.



학교에서 가르쳐주지 않았지만 가장 중요한 스킬들

두 달간 가장 많은 시간을 쏟은 일은 데이터를 모으는 작업이다. 대학원 수업에서 이 단계는 교수님이 주시거나 캐글같은 사이트에서 다운받는 CSV 파일로 거의 건너 뛰었다 (데이터베이스 과목에서 SQL 배운거 제외). 학교 수업은 그렇게 얻은 데이터를 어떻게 분석, 시각화, 모델링 해야 하는지에 대해 치중했다.


그러나 현실에서는 잘 정리된 CSV 파일과 데이터 사전은 있으면 좋지만 없어도 이상할건 없다. 데이터를 모으기 위해서는 다음 질문을에 답해야한다:

내가 필요한 데이터는 무엇인가

데이터는 어디에 있는가 (데이터베이스에? AWS에? 벤더 담당자에게?)

데이터는 어떻게 끌어올 수 있는가 (API 연결? SQL?)

데이터에서 내가 필요한 디멘젼, 메트릭은 무엇인가, 어떻게 데이터를 필터링, 조인 할 것인가


데이터 분석, 모델링이 실제로 지지고 볶는 요리 단계라면 데이터 수집은 시장에 가서 장을 보는 단계에 해당한다.


또 다른 중요한 스킬은 데이터 사이언스 업무를

의뢰한 회사 내부 고객(예: 마케팅 매니저)의 니즈를 정확히 파악하는 능력이다. 모든 사람들이 자기가 해결해야 할 비지니스 문제를 정확히 정의할 수는 없다. 그리고 그 비지니스 문제를 해결하는데 데이터 사이언스가 어떻게 기여할 수 있을지 문제를 해석하는 것은 데이터 사이언티스트, 애널리스트의 역할이다. 그래서 찰떡같이 알아듣기 위해서 우리 회사에서 어떤 일들이 일어나고 있는지, 업계는 어떻게 돌아가는지 계속 귀를 열고 있어야 한다.


몇 달 뒤, 몇 년 뒤에 또 어떻게 생각이 바뀔지 모르겠지만 지금 하고 있는 생각을 요약하면, 복잡한 긴 코드로 ‘딥러닝’, ‘인공 지능’ 같은 최신 기술을 적용해서 멋있게 보이는 것보다 비지니스에 실질적이고 의미있는 변화를 가져오는 일들이 더 중요하다는 것. 그리고 그 변화를 만들기 위해서는

데이터 사이언스를 현업에 적용해줄 내부 고객과의 협력, 그리고 내 업무의 재료가 되는 데이터를 확보해야 하는 것이 기본이라는 것.










브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari