통계 공부를 다시 시작했습니다.
전공의 시절에 논문을 쓸 때는 통계에 대한 아무 개념이 없는...말 그대로 무지성의 상태였습니다. 당시에 어떻게 논문을 썼나 싶습니다.
논문을 쓰지 않는 지금 오히려 통계에 대해서 더 많은 공부를 했습니다.
사실 통계 공부를 바로 시작한 건 아니었습니다.
AI, 머신 러닝에 대한 시대적 관심이 높아지면서 뒤처지지 않으려면, 당장에 써먹지는 못하더라도 배워는 놔야겠다는 생각이 들었습니다.
머신러닝에 대해서 공부를 시작하면서 선형 회귀, 로지스틱 회귀 등 통계학적인 내용을 접하게 되었습니다.
보통은 통계에 대한 기본적인 개념이 있는 상태에서 머신 러닝을 배우는데 저는 반대로 시작한 셈입니다.
그런데 통계 관련 지식들이 머신 러닝 관련 책들에 생각보다 잘 설명돼있어서 처음에 개념을 잡기 좋았습니다.
'파이썬 머신러닝 완벽 가이드', '혼자 공부하는 머신러닝 + 딥러닝' 이 두 가지의 책이 특히 도움이 많이 되었습니다.
http://www.yes24.com/Product/Goods/87044746
http://www.yes24.com/Product/Goods/96024871
통계에 대한 기본적인 지식들이 쌓이면서 제가 잘 모르는 통계 기법에 대해서도 관심이 가기 시작했습니다.
제 전공 분야의 의학 논문을 보면 흔히 나오는 통계 기법으로 t-test, ANOVA, chi-square test 가 있습니다.
이런 통계 기법에 대한 기초적인 이해가 부족하니 아무래도 논문을 깊이 읽는 게 힘들었습니다. 통계는 논문에서 말하고자 하는 것을 표현하는 언어라고 생각합니다. 저자는 통계라는 언어를 통해 본인이 주장하는 바를 말하는데 정작 저는 통계라는 언어를 제대로 알지 못하지 저자가 말하는 바를 이해 할 수 없었습니다.
통계에 대한 대략적인 개념이 잡힌 지금은 이 논문이 말하고자 하는 내용에 대해서 더 깊이 이해할 수 있게 된 것 같습니다. 저자가 말하고자 하는 바를 알아듣기 시작한 것입니다.
통계를 공부하면서 느낀 점은 '최대한 쉽게, 직관적으로 이해할 수 있는 설명이 중요하다'는 것이었습니다.
처음부터 수식을 들이대면 가장 중요한 본질적인 부분, '이 통계 기법을 어떤 방법을 이용해 무엇을 알고자 하는 것인가?'를 놓칠 수 있습니다.
가장 중요한 본질적인 부분을 익힌 후에 수식을 이용한 더 깊이 있는 이해가 뒤따라야 한다고 생각합니다.
'youtube가 없었으면 정말 어쩔 뻔했을까?'라는 생각을 종종 합니다. youtube에는 각종 분야의 전문가들이 재능기부라도 하듯이 본인들이 갈고닦은 지식을 일반 대중들에게 퍼주는 듯합니다. 물론 채널이 커지면서 personal branding을 얻을 수 있으며 소정의 광고수입을 얻을 수는 있겠지만(전문 분야들은 보통 조회수가 높지가 않아 실제 광고 수익도 거의 없다시피 할 것입니다.), 해당 영상을 보는 제 입장에서는 이럴 내용을 무료로 볼 수 있다는 게 정말 감사할 따름입니다.
저는 통계도 youtube로 공부했습니다. 대학원에서도 의학 통계 강의를 듣기는 했습니다. 그렇지만 강의를 들으면서 저 교수님이 도대체 무슨 말씀을 하고 계신 건지 이해가 도저히 안 가서 종강 후에도 제 머릿속에는 남는 게 전혀 없었습니다. 하지만 youtube에 올라와있는 통계 강의는 저 같은 '통알못'들에게도 가뭄의 단비처럼 이해하기 쉬운 영상들이 많았습니다.
특히 도움이 많이 된 채널은 https://www.youtube.com/c/SapientiaaDei/featured 입니다. 강의하시는 분의 정확한 이력은 알 수 없으나, 인문계열 박사 과정 마치신 분으로 보입니다. '통알못'이 무엇을 모르고, 왜 이해를 못하는지 정말 잘 간파하시고 정말 이해가 잘 되게 설명해주십니다.
주로 통계 기법들에 대한 개념적인 이해와 논리 구조와 같은 가장 기본적인 부분들, 핵심적인 부분들의 기초를 잘 쌓을 수 있도록 해줍니다.
학습을 할 때 가장 좋은 방법은 다른 사람이 이해 할 수 있도록 가르치는 것입니다.
척추에 대해 비의료인도 이해하기 쉽도록 글을 쓰는 목적은, 제 전공 분야에 대해 더 깊게 이해하고자 하는 수단입니다. 마찬가지로 통계와 머신러닝에 대해서 더 깊게 이해 할 수 있도록 통계와 머신러닝에 대해 쉽고 직관적으로 이해 할 수 있는 방식으로 글을 써보고자 합니다.