드디어 레벨업 구간
빅데이터 분석기사를 우열곡절 끝에 합격했다. 지난번에 '0점 대란'을 겪었다는 글을 올렸었데, 역시 채점이 잘못된 거였다. (참고 : [헤럴드경제] “100여명이 0점”…국가기술 자격시험 채점 오류에 수험생들 ‘분통’)
올해 상반기에 이룬 유일한 성과다. 이것마저 없었으면 정말 아찔했을 것 같다. ㅠㅠ 여튼, 꽤 공을 들여서 준비한 시험이었던 만큼 후기를 공유해보고 싶다.
1. 필기
준비기간 : 한달 안팎(3월6일~4월16일)
공부자료 : 이상철 교수 유튜브 채널 (통계분석, 데이터마이닝)
체감 난이도 : 최상(아니다 다를까 턱걸이 합격)
2. 실기
준비기간 : 한달 안팎(5월24일~6월 18일)
공부자료 : adp 실기 책(필기시험에서 한차례 쫄았던 나는 빅분기의 상위호환 시험인 ADP 실기 책으로 공부를 했다. 내가 본 건 데이터에듀에서 나온 책이다. R로 준비하는 바람에 선택의 폭이 넓지 않았다. 책에 소개된 코드는 그냥 참고 정도만 하는 게 좋겠다. 페이지 수를 늘리려는 전략인지는 모르겠으나 더 단순하게 짤 수 있는 코드를 굉장히 복잡하게 만들어서 안내한다.)
공부자료2 : 통계분석, 데이터마이닝 기법별로 사용할 함수들과 절차들을 표로 대강 정리했다. 필요한 사람은 받아가시길. (R 언어)
체감 난이도 : 중하(데이터 수집, 전처리, 시각화 정도가 난도 높은 대목이 아닐까 싶었는데 이번 시험에선 안 나왔었다.)
3. 총평
1) R 말고 파이썬으로 공부할 걸 그랬다.
- 주식을 할 때도 거래량이 많은 종목을 선택하라고 하지 않던가. 프로그래밍 언어도 마찬가지다. 파이썬은 R에 비해 사용자가 훨씬 많다. 그만큼 교재나 자료가 풍부하다.
2) 작업 제2유형을 만점 받았는데 솔직히 좀 의아하다.
- 내 모델(로지스틱 회귀모델)의 정확도는 0.62 정도의 수준이었다. 코드를 단순하게 짰다. 데이터 전처리도 안 했다(결측값이 없어서).
- 오히려 고수들 중에 빵점을 맞은 사람이 몇몇 있었다. 코드를 좀 복잡하게 짜는 바람에 코드가 돌아가기까지 1분 이상의 시간이 걸려 0점 처리를 받았던 것. 제3자가 봐도 억울한 대목이다. 채점의 편의가 자격증 시험의 취지를 망치다니.
3) 데이터 분석이 적성에 꽤 맞는 것 같다. 하지만 아직 갈길이 멀다. 자격증은 땄지만 이 실력으로는 실전에 못 나간다. 캐글 대회나 공모전에 나가면서 실력도 쌓고 포트폴리오도 만들어보련다.