8월 한 달동안 한국데이터산업진흥원에서 진행하는 데이터 분석 준전문가 시험(ADsP)을 준비했다. 시험공부를 시작하기 전에 ADsP에 대해 검색해 보니 생각보다는 정보가 많지 않았다. 그래도 책에서, 그리고 주변에서 얻은 정보에 따르면 문과 백그라운드를 가진 나도 한 달 정도 준비하면 합격할 수 있을 것 같다는 생각에 일단 시험 접수부터 했다. 게다가 패스트캠퍼스 데이터 사이언티스트 과정을 수료한 만큼 머 할 수 있겠지? 라며 느긋느긋 공부를 시작했다.
문제집을 한 권 정도 사서 준비하기로 했는데 처음에는 60점 이상이면 합격이니 합격만 하면 된다는 생각으로 시작했는데 마지막으로 가면서 시간을 투자하면 할수록 욕심이 나기는 했다. 이왕 하는 거 90점 이상 받고 싶다... 하지만 욕심과 노력은 완전히 일치하지 않았지만 말이다.
시험은 총 3개 파트로 나눌 수 있는데 데이터 이해 10문제, 데이터 분석 기획 10문제, 데이터 분석 30문제로 총 50문제이다. 데이터 이해나 데이터 분석 기획은 이론적인 부분으로 하루 분량을 좀 공부하는 게 지겨웠는데 시험치기 전에 문제를 풀어보면 은근 기억이 안나고 좀 많이 디테일한 것을 객관식으로 헷갈리게 하는 시험이라 시험치기 전에 다시 한 번 봐야 했다.
데이터 분석 파트는 다시 R과 통계, 데이터 마이닝 이론으로 나눠지는데 걱정했던 R은 파이썬 언어를 배운 경험이 있어서인지 파이썬과 비교하면서 그다지 어렵지 않게 이해할 수 있었다. R로 직접 프로그래밍하는 것도 아니고 R 언어를 어느 정도만 이해하면 풀 수 있는 시험이기에 괜찮았다. 내 약점이 가장 드러나는 부분은 바로 통계 부분이였다.
사람마다 무엇을 배울려고 하면 약점이 드러나듯 요가를 하면 발목이 아픈 사람은 연꽃 자세가 힘들고, 허리가 아픈 사람은 허리를 구부리는 동작이 힘들다. 둘 다 내 이야기다 ㅋㅋ 문제집에서 통계 부분을 공부하면서 머리를 쥐어 뜯고 싶은 순간이 몇 번 있었다. 통계학을 공부한 적이 전혀 없는 나로써는 문제집에 시험에 나올 법한 핵심만 간추린 내용을 이해하기 힘들었다. 인터넷에서 자료를 찾아가며 겨우 공부했는데 덕분에(?) 통계학에 대해 관심이 생기기는 했고, 처음 배우는 사람들에게는 자세한 내용보다 하이레벨에서 개념에 대한 이해를 충분히 하고 배워 들어가는 게 중요하다는 생각을 다시금 했다.
결론적으로 나는 약 한 달이라는 시간 가운데 반을 이 통계 부분에 할애한 듯 하다. 그렇다고 통계를 잘 알게 된 것도 아니다. 그냥 통계가 이런 것이구나 하면서 눈을 뜨게 된? 정도고 지금까지 배운 머신러닝 이론이 이렇게 연관될 수 있구나하고 생각한 정도다. 모르면 넘어가기 힘들어하는 자기 만족적인 부분이였다....
마지막 데이터 마이닝인데 이 부분은 그 동안 머신러닝 이론을 공부했으니 괜찮겠지라고 생각했는데 책을 통해 다시 공부할수록 이런 알고리즘들의 개념을 좀 더 깊이 이해하고 잘 설명할 수 있으면 좋겠다는 생각이 들었다. 물론 이는 시간이 걸리는 일이고 이번 한 달 안에 모두 그럴 수 없기에.. 개념을 확인하고 외울 껀 외우는 식으로 공부를 끝냈던 듯 하다. 그리고 문제집들마다 비슷하겠지만 마지막 모의고사를 2-3차례 풀어보면 시험에 나오는 감을 잡을 수 있을 것이다.
시험을 치고 나오면서 헷갈리는 문제가 5개 정도 있어서 5개 정도 틀렸겠지라고 예상했는데 생각보다 2배는 틀렸다. 자격증을 몇 번 따본 적이 없는데 이번 시험을 보고 느낀 점은 이런 자격증들은 먼가 그 분야의 전문성을 입증한다기 보다 '이런 걸 공부하고 준비했습니다'라는데 의의가 있는 게 아닌가 싶다. 그리고 이 과정에서 점수 말고도 진짜 실력을 조금이라도 늘리는 데 도움이 되었다면 그건 시간낭비가 아닐 것이다.