brunch

You can make anything
by writing

C.S.Lewis

by Kay Feb 19. 2024

데이터 분석, 통계와 수학이 정말 중요할까

데이터 공부를 처음 시작하는 당신을 위한 조언

데이터를 공부하기 전과 후 달라진 점은 무엇일까


누군가의 질문이 있을 때, 이제는 나도 그럴싸한 분석을 할 수 있게 되었다고 자신 있게 말할 수 있으면 좋겠으나 아쉽게도 야생의 데이터를 직접 핸들링하는 것에는 여전히 겸손해질 수밖에 없는 게 어쩔 수 없는 사실이다. (인정하고 싶지 않지만 뼛속까지 문과인 나이기에 앞으로도 쭈욱 그 자신감이 생기기는 어렵겠다는 생각도 한다.) 하지만 그럼에도 확실하게 달라진 한 가지를 꼽으라면 데이터를 공부하는 초심자들이 거치는 사고의 흐름을 이해할 수 있게 되었다는 것이다. 데이터를 전혀 모르던 입장에서 하나씩 배워가고, 또 내가 가진 실제 데이터를 활용한 프로젝트를 해보니 남들이 데이터 수집부터 전처리, 분석이나 모델링의 각 단계에서 마주하게 되는 생각이나 고민에 대해 어느 정도 공감할 수 있게 된 것 같다. 


또, 학교 수업에서 기본기로 다뤄지는 내용들이 이후에 어떤 측면에서 활용되는지를 어느 정도는 이해하게 된 것 같다. 일반적으로 학교에서 인공지능 전공과목 공부를 시작하는 경우 수학이나 통계 과목을 먼저 진행할 것이고, 그 전공에서 분석 툴로서 파이썬을 처음 배우는 경우 교육에서 리스트, 튜플, 딕셔너리 등과 같은 변수 타입을 먼저 다루고 있을 것이다. 물론 그 모든 내용이 중요한 것은 맞지만 적어도 내가 관심을 갖고 있고 직접적인 활용을 생각하고 있는 HR Analytics를 시작하는 사람의 입장이라면 내용이 이해되지 않고, 그렇다 보니 중요성에도 공감하지 않게 마련인데 다행히 학위 과정을 마친 이후 어느 단계 어떤 장면에서 어떠한 고민을 해결할 때 그것들이 중요하게 활용될 수 있는가에 대해 이해할 수 있게 된 것이다. 그럼에도 다시 한번 말하지만 그 내용들을 이해했다거나 안다는 것은 아니고, 그 과목이나 수업에서 다룬 내용들이 어느 장면에서 등장했었는지에 대해 떠올릴 수 있게 됐다거나 ‘그때 그 개념이 이 단계에 필요했던 것이구나’ 정도의 이해를 뜻한다.



연구방법론, 그게 정말 최선인가


오래된 기억이지만 일반대학원에서 교육학 석사 공부를 하던 시기에 매 학기 반차를 내고 낮 수업으로 연구방법론 수업을 들으면서 가졌던 불평불만들이 생각난다. 석사 마지막 학기에 논문 데이터를 통계 분석 하면서 했던 생각인데 결국엔 SPSS로 버튼 몇 개 눌러서 돌리는 일이고, 해석도 결정계수랑 P-value가 몇인지 보는 건데 왜 정작 매 학기 수업에서는 통계의 개념과 수식을 통해서 설명이 이뤄지고, 중간기말 시험은 공학용 계산기만을 써서 직접 계산해야 하는 그 과정이 정말 어려웠고 또 힘들었던 것으로 아직도 기억에 남아 있다. 적어놓고 다시 살펴보니 참 석사스럽기도 하고, 일부만 아는 놈의 건방진 생각이기도 한 것 같다.



데이터 공부 시작을 위한 최고의 선택, LG Data 분석 Camp


잠시 이야기를 돌려서 내가 진행하는 교육 중 하나에 대한 얘기를 해보려고 한다. 이 프로그램은 단순히 ‘데이터를 알고 싶어요’ 수준을 넘어  직접 분석을 해 보고자 하는 현업의 일반 구성원들을 대상 10일짜리 파이썬 기반 데이터 분석 교육이다. 8시간씩 10일 간 진행하는 수업이니 시간적으로 대학교 한 학기 수준은 되는 엄청난 투자라고 생각한다. 물론 강의 자체는 데이터 분석가인 강사가 진행하고 있지만 교육의 전체적인 진행 방식이나 그 안에서 내용을 포함하고 빼는 것, 그리고 어느 부분에 힘을 주고 뺀다거나, 전체를 아우르는 실습 또는 프로젝트 방식이나 데이터셋 등에 대해서는 프로그램의 기획자로서 깊이 있게 관여하고 있다. 교육만족도 이야기를 하는 것을 썩 즐겨하지는 않지만 정량지표 얘기를 해 보자면 올해 총 6 차수 동안 다양한 계열사와 직군에서 163명이 참가한 프로그램의 평균 만족도는 5점 만점에 4.93이고, 과정의 순추천지수(NPS)는 91.4%이다. 물론 무림의 고수인 HRDer들께서 진행하는 이보다 더 나은 품질의 프로그램들이 많이 있겠으나 일회성으로 전력투구 하는 것이 아니라 연간 다 차수를 진행하는 교육에서, 동기부여와 같은 말랑한 내용이 아닌 직무 콘텐츠를 다루면서, 게다가 진입장벽이 높은 파이썬을 활용한 데이터 분석 교육이란 점에서 개인적으로는 잘 짜여진 프로그램이라고 생각하고 있다.


데이터를 공부하면서 강사와 의기투합해 이 프로그램 진행 방식 상 차별화 포인트로 삼은 부분들이 몇 가지 있다.  


통계와  수학, 변수 타입 이야기는 본 과정 내용에는 포함하지 않는다.
- 마이크로 러닝 콘텐츠로 궁금한 내용을 찾아볼 수 있게 제공
- 궁금한 것이 생겼을 때 요즘 학습자들이 정보를 취하는 방식에 대한 설명
학습 과정에서 그들이 품는 생각에 대해 공감하고, 해석해 준다.
- 학습의 전후 과정에 교육생들을 참여시키고, 일상의 데이터에 대한 생각을 서로 공유 
데이터 분석 전체 관점에서 일차 별 학습 내용이 갖는 의미를 짚어준다.
- 메타인지 관점에서 그날그날의 학습 내용을 정리
- 이후 작업에 어떻게 활용될 것인지 설명을 통한 연결 고리 마련
현업 데이터와 구조가 비슷한 데이터셋을 활용한 실습과 프로젝트를 진행한다.   



그래서 공부를 하라는 건지 말라는 건지 


수학과 통계, 변수 타입과 같은 기본기는 중요하다. 그것도 아주 많이. 흉내만 내는 것 말고 제대로 한 번 해보겠다 마음먹은 순간에 수학에 대한 이해는 데이터 분석이나 모델링을 함에 있어 설계도 역할을 하게 될 것이다. 또한 통계적인 개념에 대한 이해는 데이터 분석 과정을 통해 자신이 발견한 것들에 대한 가장 든든한 지원자가 될 것이다. 그리고 그 분석이 진행되는 과정에서 변수 타입을 알아야만 작업 진행 상의 변주가 가능해진다. 하지만 연구방법론을 듣던 그 시절에도 HRDer였고, 지금은 심지어 그룹 연수원에서 데이터 분석 쪽 교육 프로그램을 담당하는 입장에서 보자면 데이터나 인공지능을 전공하려는 것이 아니라 데이터 속 숨은 의미 발견 후 다음에 취할 행동이 더 중요한, 말 그대로 1분 1초가 아쉬운 실무자들이 단시간 내에 데이터를 바라보고 다루는 방식을 공부할 때라면 기본기에 해당하는 것들이 오히려 조금 나중에 그리고 다른 방식으로 전달되어도 좋을 것 같다. (솔직한 마음은 전공자들의 교육도 마찬가지이고 전공자 대상의 교육부터 바뀌어야 그들이 언젠가 전문가로서 진행하게 될 다수의 비전공자 대상 교육이 바뀔 것이라고 생각하지만 그쪽을 논하기에는 아무래도 주제넘는 것 같아서 괄호 속 생각으로만 남겨둔다.) 


넓은 바다를 먼저 보여주고, 그곳에 출렁이는 파도가 있음을 알게 된다면 누군가는 수영을, 누군가는 서핑을, 그리고 누군가는 항해가 하고 싶어서 각자 필요한 것들을 찾아서 공부할 수 있을 것이다. 분석 경험이 쌓이고 자신의 부족함을 알아가기 시작한다면 망망대해 같은 데이터 바다를 헤쳐 나가기 위해 수영과 서핑, 항해 기술 모두에 대한 이해가 필요한 것은 맞지만 적어도 시작하는 단계에서만큼은 앞으로 벌어질 일들을 우선 한 번 마주해 보는 것도 좋은 시작이 될 수 있다.

작가의 이전글 정성의견 분류&감성분석 시스템 개발 사례③
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari