국비지원 혜택을 받을 수 있는거 이왕 경험해보면 좋겠다는 생각이 있기는 했는데,
막상 경험을 할 계기는 없었다.
국비지원 코딩교육을 듣게 된 계기는 조금 엉뚱하기는 하지만,
어찌되었던 쪼끔은 관심이 있던 데이터 분석 수업을 듣게 되어 좋은 기회라고 생각한다.
게다가 부트캠프는 나이 제한이 있기 때문에 여기에서 조금 더 먹으면 혜택을 못 받는다.
그러니 지금이 딱 적당한 시기이다.
(1) 통계학
무엇보다도 데이터를 다루는데에는 통계학이 기초이다보니
부트캠프에서도 통계학을 가장 앞단에 배운다.
원래 통계학은 재미가 없다고 느꼈는데,
수식으로 analytical 하게 풀리지 않고, 실험/시뮬레이션도 쉽지 않은 사회과학에서
통계학은 없어서는 안될 도구라는 점을 알게되면서 생각이 바뀌었다.
특히 <가족과 통치>라는 책을 읽으며 통계학이 가진 매력이자 현대 사회에서의 위력 알게 되었다
"19세기 서구에서 통계가 산재하는 수(數)의 집합에서 현상의 일반적인 패턴을 발견하는 테크놀로지로 발전해갔듯이,
통계 지식의 생산은 국가관료들에게 새로운 방법으로 인구의 특징을 기술하도록 만들어주었다.
통계는 사회에 관한 법칙의 형태, 사회적 사실의 속성을 발견하고 파악하는 과학이 되었고,
그 결과 사회적 법칙은 통계적 형태를 띠게 되었으며, 통계적 사실들이 사회의 패턴을 발견하면서
'사회적 사실'은 그 속성상 '통계적 사실'이 되었다."
사실 대학원 전공이 '통계'물리학이어서 '통계적 접근'을 사용한다고 소개는 했어도,
통계학에서 사용하는 회귀분석이나 가설검정같은 기법을 직접적으로 사용하지는 않았기에,
어떤 일반적인 관념과는 다른 의미로의 '통계'이기는 했다.
하지만 어느 분야던지 기본적으로 실험을 하거나 시뮬레이션을 할 때에 통계를 사용하지 않는 곳이 없다.
실험을 한 번만 해서 결론을 내는 일은 거의 없다고 할 수 있고,
여러 번 실험해서 평균/표준편차 등 기술통계를 활용한다.
그러니 이름에 '통계'가 붙지 않더라도 과학을 한다면 어찌되었던 기본적인 통계의 개념은 사용하게 된다.
그리고 통계적인 기법을 직접적으로 사용하지는 않더라도,
통계의 어떤 기본 가설이나 배경은 모두 통계통계한 배경에서 유래되었으니,
나는 통계는 싫어하면서 통계물리학을 전공했고,
한편으로는 통계를 쓰면서도 내가 통계를 안쓴다고 생각한 어리석은 존재였다.
대학원에서 '통계'물리학을 하면서이든지
아니면 실험과 시뮬레이션에서 의미있는 결과를 얻기 위한 수단으로 사용하던지
심리학에 관심을 갖고 통계학 공부를 했을 때던지
이렇게 저렇게 귓동냥하며 대충 알고 있던 통계적인 기법이든 접근법이든지
부트캠프에서 제대로 이해하게 되었다.
수업에서는 수식보다는 개념적인 이해를 중점으로 다루었지만,
강사님이 통계학을 전공하셨기에 내가 공부하며 의문이 갔던 지점들도
수식을 곁들여가며 편하게 물어볼 수 있어서 좋았다.
(2) 시각화
데이터 분석 직무는 데이터를 분석하기도 하지만
분석 결과로 누군가를 설득하거나, 소통하기도 해야해서
분석 결과를 보기 좋게 시각화 하는 일도 할 줄 알아야 한다.
개인적으로 시각화를 좋아한다.
한 눈에 보기 좋게 정리하는 일을 좋아하기도 하고,
어떤 색깔을 사용할지 고르는 일도 재미있게 느껴진다.
화장을 가뭄에 콩 나듯 하던 시절에도
하늘 아래 같은 색조는 없다는 신념으로
여러 아이섀도우 팔레트를 모으곤 했을 정도로
다양한 색깔을 좋아라했다.
그러니 시각화 하는 작업도 재미있게 느껴질 수 밖에.
대학원에서 논문 쓸 때에도 시각화는 중요하다.
내 연구 결과를 잘 전달할 수 있는 그림을 그려야 했고,
또 공간 제약이 있는 상태에서 많은 정보를 최대한 깔끔하게 담아내려고
머리를 싸맸던 기억이 있다.
그 때에는 구현하고 싶은 기능이 있으면, 폭풍 검색을 해서 찾아냈고
또 막상 구현하고 나면 마음에 안들어서 미세 조정하느라 시간이 많이 들었는데,
요즘에는 ChatGPT에게 물어보면 휘리릭 코드를 짜주니,
시각화에 들이는 시간과 노고가 줄었다.
대학원에서 고생하며 익혀서 그런지 나는 python으로 시각화 하는데 여러모로 편한데,
요즘 데이터 분석에서는 태블로(Tableau)라는 시각화 툴도 많이 쓰인다.
구인공고를 보다보면 Python과 R은 오히려 후순위이고
Tableau로 시각화할 줄 아는 사람을 찾는 느낌이다.
Tableau는 클릭과 드래그로 마우스를 쓰면서 시각화 할 수 있는 툴이다.
하지만 나는 도대체 무슨 기능이 어디에 있는지도 모르겠고,
기능 구현이 좀 명확하지 않을 때도 있어서 python을 선호한다.
그렇지만 구인 공고에서 Tableau를 더 선호하는 듯 하니,
귀찮더라도 익혀놓기는 해야겠다.