<매드타임스> 칼럼 기고문
<매드타임스> 칼럼 기고문
몇 년 전부터 데이터 분석에 대한 온라인 교육 과정을 진행하고 있다. 한 클래스가 대략 한 달 과정인데 평일에는 제출된 과제에 대해 피드백하고 주말에는 종합 평가 차원에서 온라인 강의를 하는 식이다. 데이터 분석 과정이기는 하지만, 코딩이 전부가 아니라는 걸 알려주기 위해 시작한 수업이라 코딩이나 통계를 잘 몰라도 신청할 수 있고 진행하는 과정도 아무 무리가 없도록 구성했다.
이미 잘 정제된 데이터를 활용하기 때문이다. 수강생들은 주어진 데이터로 분석이 가능한 트렌드 하나를 스스로 정하고 관련 데이터를 추출하고 추출된 데이터들을 차트에 얹으면서 데이터 분석 보고서를 작성하게 된다.
이 과정을 통해 수강생들은 어떤 업무를 경험하게 될까.
먼저 주어진 데이터의 특성과 한계를 파악하게 된다. 즉, 내가 분석하고 싶은 주제를 주어진 데이터로 분석할 수 있는지가 고민의 시작이다. 그다음에는 분석 목적이나 목표, 가설을 작성하게 되며 설계의 중요성을 배우고 이후부터는 차트를 만드는 방법과 하나의 차트에서 어떤 내용을 읽을 수 있는지, 또 문서의 타이틀과 설명 내용을 어떻게 작성해야 하는지 배운다. 그리고 결정적으로 분석과 해석의 차이를 알게 되어서 데이터를 단순히 읽는 것뿐만이 아니라 읽은 내용에 나만의 견해를 붙이는 과정을 심도 있게 학습하게 된다. 데이터 분석의 결론이 반드시 예측이나 제안일 필요는 없다는 것을 알게 되어서 현재 상황을 잘 정리하는 것에 집중하게 된다.
이 수업이 벌써 30회 가까이 진행되었다.
한 클래스 당 수강생이 평균 6~7명 정도였으니까 이제까지 대략 200명 정도를 가르쳐 본 셈이다. 이직을 준비하는 직장인도 있지만, 대부분은 취업 준비생과 재학생들이었기 때문에 다양한 학과생들을 경험했다. 요즘은 학과명 자체가 워낙 예전과 달라지기도 했고, 특정 학문보다는 다양한 학문을 배우는 융합학과들도 많이 생겼으며, 학교별로도 학과명이 조금씩 달라 정확하게 학과명을 명시하기는 어렵지만, 대략 통계학, 컴퓨터공학, 산업공학, 빅데이터학, 경영학, 경제학, 광고홍보학, 인문학, 사회학, 철학, 사회복지학, 심리학 등 정말 다양했던 것 같다. 학과뿐만 아니라 학교도 천차만별이었다. 서울이나 경기권에 있는 대학부터 지방에 있는 대학까지.
진짜 학과에 대한 차이가 있을까? 석사도 아니고 학사에서? 실제로 차이는 있었다.
그런데 차이가 있다는 것이지 유리하다는 정도까지는 아니었던 것 같다. 유리하다기보다는 학과마다 강점을 보이는 구간이 별도로 존재한다고 하는 것이 더 타당하다.
통계학 전공자들은 확실히 숫자를 보는 데 익숙하다. 거부감이 없다는 것만으로도 큰 장점이 된다. 경영학은 트렌드, 산업이라는 용어에 익숙하다. 주제를 잘 잡는다. 문서를 작성하거나 구성하는 데도 익숙해서 깔끔한 인상을 준다. 어문 계열이나 사회학, 심리학, 철학 등 전공자들은 결과를 해석하고 문장을 작성하는데 강점을 보였다. 심지어 단어 선택도 탁월한 때가 있는데 매우 인상 깊었다.
이건 내가 진행하는 수업이 코딩을 잘하는지, 통계를 잘 알고 있는지 등을 평가하는 게 아닌, 데이터 설계와 가설과 관점과 스토리텔링을 학습하는 데 초점이 맞춰져 있기 때문일 것이다. 그래서 소위 전공자들과 비전공자들의 차이가 극명하게 갈라지지 않았을 수 있다.
그렇지만 반대로 얘기하면, 데이터를 정제하고 가공하는 기술적인 부분을 제외한 앞뒤의 모든 과정에서는 학과별 차이가 크지 않다는 것을 의미한다. 그런데 데이터를 분석하는 전체 과정에서 정제나 가공 등의 기술적인 부분이 차지하는 비중이 얼마나 될까? 수치로 명확하게 환산할 수는 없겠지만 아무리 낮게 잡아도 50대 50이다.
그러니까 만약 내 논리에 동의가 된다면, 우리는 데이터 분석의 전체 과정 중 겨우 절반의 과정만을 기준으로 전공자와 비전공자를 나누고 있었다는 얘기가 된다. 본인이 남들보다 코딩 역량이 조금 부족하다면 나머지 절반에 해당하는, 데이터를 설계하고 해석하는 과정에서 두각을 나타낼 수 있다는 걸 명심하자.
그리고 학교나 학과의 차이 외에도 데이터를 분석한 결과물의 차이에 영향을 주는 변수들이 있다. 가령 논문을 작성해 본 경험이 있는지나 발표 문서를 만들고 직접 발표한 경험이 있는지, 평소에 글 쓰는 걸 좋아하는 편인지, 질문하는데 거리낌이 없는지 같은 아주 소소한 경험이나 태도 같은 것들 말이다.
마지막으로 200여 명의 학생을 가르치면서 얻은 교훈이 있다.
데이터 분석은 결국 치열하게 데이터를 보려는 의지를 가진 사람이 위너가 된다. 아무리 뛰어난 기술을 가지고 있어도 데이터를 열심히 보는 사람에게는 이길 수 없다는 게 내 지론이다. 유독 데이터를 보면서 궁금한 게 많이 생기는 사람들이 있다. 그래서 자꾸 이런저런 데이터를 찾아보는 사람들이 있다. 필요한 사람이 우물을 파게 되는 것이다.
http://www.madtimes.org/news/articleView.html?idxno=19626
출처 : 매드타임스(MADTimes)(http://www.madtimes.org)