가장 먼저 고민해 봐야 할 것
언젠가 어떤 식으로든 글로 풀어낸 기억이 있기는 하지만 최근 다시 한 번 느끼는 바가 있어 끄적거려 본다.
가끔 외부 강의 등을 통해서 학생들을 만나면 이런 질문을 많이 받는다.
"데이터 분석가가 되려면 어떻게 해야 하나요?"
여기서 데이터는 빅데이터를 의미한다. 이런 질문을 받았을 때 나의 대답은 한결같다.
"어떤 데이터를 다루고 싶으세요?"
그런데 이 질문을 하면 대부분은 머뭇거린다. 아직 잘 몰라서.. 아직 거기까지는 생각을..
그러면 또 이렇게 물어본다. 이떤 회사에서 일하고 싶은가요? 어떤 산업 분야에서 일하고 싶은가요?
그래도 대부분은 머뭇거린다. 아직 잘 몰라서.. 아직 거기까지는 생각을..
소프트웨어학과를 다니는 학생에게 물었다.
만약 내가 소프트웨어학을 하고 싶다고 하면, 소프트웨어와 관련된 일을 하고 싶다고 하면
어떤 얘기를 해 줄 것 같은지.
"어떤 소프트웨어요?"
맞다. 데이터도 마찬가지다. 빅데이터는 더 그렇다. 산업마다 회사마다 다루는 데이터의 종류가 다를 수 있다.
숫자로 된 데이터도 있고, 문자로 된 데이터도 있고, 이미지나 영상 데이터도 있다.
파이썬으로 다룰 수 있는 데이터가 있고, SQL로 다룰 수 있는 데이터가 있다.
어떤 한 친구는 게임회사에서 데이터 분석을 하고 싶다고 말하면서 파이썬을 공부하고 있다고 했다.
커뮤니티 등에 게시된 소비자 게임 리뷰 데이터를 수집할 수 있다고 했다.
물론 그런 데이터를 볼 수도 있거나 봐야 하는 순간이 오기도 한다.
그런데 예상해 보건대, 게임회사에서 주로 다루는 데이터는 게임을 이용하는 소비자들의 데이터일 것이다.
언제 게임에 접속을 했는지, 얼마나 자주 접속을 해서 얼마나 오랫동안 게임을 플레이 하는지 등.
User의 행동을 기록하고 모니터링하는 게 제일 중요한 데이터가 아닐까?
그리고 User의 행동은 숫자나 날짜, 문자 등으로 기록될 것이며 우리 회사 어딘가에 저장되어 있을 것이다.
그러면 저장된 데이터를 불러와서 의미를 찾아내는 일을 할텐데, 그럴 때 많이 사용하는 프로그래밍 언어가 있을 것이다. SQL 같은 언어 말이다.
이런 관점에서 보면, 막연히 데이터 분석가를 꿈꾸기 보다
어떤 데이터가 있는지 찾아 보고, 어떤 회사에서 일하고 싶은지,
적어도 어떤 산업 분야에 입성하고 싶은지를 정하는 게 우선이다.
그래야지 내가 어떤 것을 우선해서 공부해야 할지를 정할 수 있다.
코딩은 어떤 걸 해야 하는지, 통계는 얼만큼 알아야 하는지, 어떤 기법을 해봐야 하는건지 등
아직 그만큼 그 데이터를 해보고 싶은 건 아닌데,
그냥 그 회사가 유명해서 생각해 본건데
다른 것도 좋아 보이는데.. 등의 생각으로 머뭇할지도 모르지만.
하나의 데이터를 정하고 나아가다가 다른 데이터나 산업, 회사로 방향을 트는 게
그냥 막연히 앞으로 가는 것보다 어쩌면 더 빠른 길일 수도 있다.
가고싶은 회사가 정해지거나 산업이 정해지면 그 회사들에서 요구하는 스펙을
모집 요강 같은 곳에서 찾아보고, 모르는 용어는 인터넷에 찾아 보며 어떤 역량이 필요한지 유추해 본다.
그리고 그런 역량을 키울 수 있는 학교나 학과 대학원, 아카데미 같은 곳을 뒤져 보는 것이다.
관련 직무에 있는 선배들과 연락이 닿을 수 있다면 무엇보다 좋고.
때로는 한 걸음에도 무수한 고민과 전략이 필요할 때가 있다.