데이터와 AI의 폭풍 속에서 살아남기
코딩이니, 데이터과학이니, AI니, STEM이니 하는 것들이 휘몰아치는 시대입니다. 수학적 지식이 해박한 이라면 하루가 다르게 발전하는 과학기술의 파도를 타고 서핑할 수 있겠지만, 그렇지 못하다면 급류에 휩쓸려 침몰해 버리기 딱 좋은 상황입니다. 데이터와 AI가 지배할 기세인 21세기 기술의 서프보드는 수학과 통계학입니다. 수학과 통계학이라는 언어를 익힌다면 기술은 미지의 위협에서 제어 가능한 도구가 될 수 있습니다. 문제는 대학 수준에서 사용하는 수학과 통계학을 모른다는 점이죠. 이공계 전공자가 아니라면 관련된 수업을 들을 기회조차 없으셨을 테고, 사실 이공계 전공자라고 해도 수학과 통계학을 한 번에 제대로 이해하기는 쉽지 않습니다. 수업 듣고 1년만 지나도 가물가물해지는 문제도 있고요. 다양한 이유로 수학과 통계학을 공부할 방법이 '독학'밖에 없는 경우가 많습니다. 이번 글에서는 오늘날의 기술을 개략적으로나마 이해할 수 있도록 수학과 통계학을 독학하고자 하는 분들께 도움이 될 수 있도록 제가 공부할 때 활용했던 무료 강의와 책들을 소개해드리고자 합니다.
본격적으로 들어가기 전에 먼저 말씀드리고 싶은 부분이 있습니다. 바로 완벽하게 할 필요 없다입니다. 수학과 통계학이 어렵게 느껴지는 이유는 그것이 어렵기 때문입니다. 당연히 한두 번 읽고 듣는다고 바로 이해되지 않습니다. 문제 하나 잡고 몇 시간씩 고민했는데도 안 풀리는 경우도 부지기수입니다. 그렇다고 해서 이해되지 않는 부분이 이해될 때까지 몇십 번씩 다시 보거나, 모든 문제를 풀어내겠다는 생각으로 덤비다가는 2~3일 만에 포기하게 됩니다. 처음부터 완벽할 필요 전혀 없습니다. 너무 어려워서 이해가 안 되는 부분은 그냥 넘기셔도 됩니다. 문제도 맛보기로 몇 개만 풀어보고 좀 어려워보인다 싶으면 미련 없이 넘겨가면서 하세요. 넘기기에는 중요해보인다면 chatGPT에 해당 부분을 복사+붙여넣기 한 다음 초등학생한테 설명하듯이 알려달라고 하시면 됩니다. 대충 지나가버리면 다음 부분 공부할 때 문제되는 거 아니냐고요? 그러면 그때 다시 보시면 됩니다. 한 번에 긴 시간을 들여 이해하는 것보다, 해당 내용이 필요할 때마다 여러 번 반복해서 다시 보시는 것이 훨씬 이해가 잘 됩니다. 그리고 열심히 공부해도 이후에 해당 내용이 다시 필요하지 않은 경우도 많습니다(물론 다른 분야에서는 필요할 수 있습니다). 경험상 한 권의 책에서 꼭 익혀야 하는 내용은 그 책 전체 내용의 3분의 1 정도밖에 안 됩니다. 그러니 완벽에 너무 집착하지 마시고, 걱정 없이 넘겨가면서 하시면 됩니다. 포기하지 않는 것이 훨씬 중요하니까요!
대학수학을 공부하기 위해서는 당연히 고등학교 수준의 수학을 먼저 갖추는 것이 필요합니다. 물론 현재는 고등학교까지가 의무교육 과정이므로 수업을 들어오셨겠지만, 역시 다양한 이유로 고등학교 수준의 수학 지식이 현재 갖춰져 있지 않은 경우가 많습니다. 빠르게 고등학교 수준의 수학 지식을 갖출 수 있도록 도와줄 강의들을 먼저 소개해 드리겠습니다.
EBS에서 만든 강의로, 50일 만에 초등학교부터 고등학교 1학년 수준까지의 수학을 다루는 '수포자'를 위한 강의입니다. 교재도 판매하므로 책과 강의를 함께 공부할 수 있습니다. 제가 직접 들어보진 않았지만, 강의의 질이 매우 높다고 알려져 있습니다. 초중고 과정 중 수학을 포기하신 분이라면 더 고민할 것도 없이 이 강의를 수강하시면 됩니다.
고2, 고3 과정을 다룬 강의는 많지만 대부분이 수능을 겨냥한 강의다 보니 우리의 목표와는 약간 다릅니다. 우리의 공부 목표는 뛰어난 문제풀이 스킬보다는 다음 과정을 공부하기 위한 개념 학습이죠. 양질의 수학 강의로 세계적 인기를 얻고 있는 칸아카데미를 통해 공부하시면 됩니다. 칸아카데미 홈페이지에 들어가보시면 '한국 학년별 수학' 부분이 있는데요. 이 중 고2, 고3 과정을 다룬 '수학I', '수학II', '미적분', '확률과 통계' 과목을 공부하시면 됩니다. 다음 사진의 빨간 네모를 참고하세요!
본격적으로 깊이 있는 통계학을 공부하시기 전에 먼저 대략적인 개념을 봐두면 훨씬 이해가 편한데요. 쉽기로 소문난 '세상에서 가장 쉬운 통계학입문'을 먼저 읽어보시는 걸 추천드립니다. "중학교 수학이면 3주 만에 끝낸다"는 슬로건을 내걸고 있는 만큼, 수학적으로 어려운 부분 없이 필수적인 통계학 개념을 익힐 수 있습니다. 쉬우면서도 필요한 개념은 다 다루고 있어, 통계학에 대한 배경지식이 전혀 없으시다면 꼭 먼저 읽어보세요!
이공계에 진학하게 되면 사실상 필수적으로 공부하게 되는 두 과목이 있습니다. 바로 미적분학과 선형대수인데요. 두 과목은 매우 광범위한 분야에서 빈번하게 활용되는 만큼 꼭 익힐 필요성이 있습니다. 미적분과 선형대수를 공부할 수 있는 책과 강의들을 소개합니다.
대학 미적분을 다룬 책은 그 종류가 정말 많습니다. 원하시는 교재를 선택해 공부하시면 됩니다. 제가 소개드리는 책은 시중에 나와있는 대부분의 교재와 달리 한국인 저자들이 지은 책이라는 점이 특징적인데요. 덕분에 번역으로 인한 가독성 저하가 없다는 점이 장점입니다. 이외에 단점이 크게 없다는 점에서 '무난함'이라는 큰 장점을 지니고 있습니다. 여기서부터는 대학 수준의 교재들을 추천드리게 될 텐데, 위에서도 말씀드렸다시피 너무 완벽하게 공부하려 애쓰실 필요 없다는 점을 다시 한번 상기시켜드리고 싶습니다. 연습문제를 푸는 게 어렵다면 통째로 넘기셔도 됩니다. 개념 부분도 읽어나가기가 버겁다면 "이런 게 있구나~"하는 정도로만 보시고 넘어가세요. 특히 많은 책에서 후반부로 갈수록 내용이 급격히 어려워지는데, 난이도에 비해 쓰임은 비교적 적으므로 일단 넘어가시고 나중에 필요하실 때 다시 보셔도 됩니다.
책에 비해 무료 미적분 강의는 굉장히 적은데요. 위에서 소개해드렸던 칸아카데미에서 대학 수준의 미적분을 가르치는 두 개의 과목이 있으므로 이 강의를 수강하시면 됩니다. 책만 보기에는 어려우실 수 있으므로 개인 취향에 따라 강의를 병행하시는 걸 추천드립니다.
선형대수학 책도 종류가 많으므로 만약 다른 교재가 이미 있으시거나 더 마음에 드신다면 다른 교재로 공부하셔도 됩니다. 제가 소개드리는 교재는 풍부한 응용 사례를 소개한다는 강점을 지닌 책입니다. 선형대수의 경우 계산이 굉장히 많아 흥미를 잃기가 쉬운데, 어떤 상황에서 내가 배우는 내용이 필요한지를 알 수 있는 응용 사례를 다양하게 소개하다 보니 공부하기가 좋습니다.
선형대수 강의도 역시 칸아카데미에서 적절한 수준의 강의를 제공하므로 참고하시면 됩니다. 단 칸아카데미 강의의 경우 제가 소개드린 두 책보다 비교적 깊이가 얕습니다. 더 깊이 있는 강의를 원하신다면 한국의 MOOC 서비스인 KOCW에서 과목명을 검색해 대학 강의 녹화본을 참고하시는 걸 추천드립니다.
앞에서는 일반적인 정규과목으로서의 미적분학과 선형대수학을 공부할 수 있는 교재와 강의를 소개해드렸습니다. 그러나 데이터과학이나 AI 기술에서 필요한 수학을 좀 더 특화해서 공부해볼 수도 있습니다. 이 강의는 고려대학교 교수들이 촬영한 것으로, 데이터과학을 위해 필요한 선형대수, 확률과 통계, 최적화 강의를 담고 있습니다. 기초적인 수준의 미적분과 선형대수 지식이 있는 상태에서 보시는 게 좋습니다.
학부 통계학과의 최종적인 목표는 '수리통계학'과 '회귀분석' 과목을 온전히 이해하는 것이라고 할 수 있습니다. 이를 학습하기 위해서는 기초통계학과 확률론을 먼저 학습할 필요가 있습니다. 대학 수준의 통계학을 공부하실 수 있는 교재와 강의를 소개해드리겠습니다.
수학적으로 지나치게 깊이 들어가지 않고 적절한 수준에서 통계학 개념을 전달하는 기초통계학 과목도 다양한 교재들이 있으며 어떤 책으로 공부하셔도 상관없습니다. 뒤에 소개해드릴 수리통계학 교재의 저자가 작성한 기초통계학 교재를 소개해드립니다. 장단점이 뚜렷하진 않지만, 그만큼 무난함이라는 강점을 지닌 책이라 할 수 있습니다.
만약 강의가 필요하시다면 KOCW에 공개되어 있는 여인권 교수님의 기초통계학 강의를 참고하시는 걸 추천드립니다. 제가 직접 강의를 듣진 않았지만, 교수법이 뛰어나다는 평이 자자합니다.
수리통계학을 공부하기 위해서는 먼저 확률론을 공부할 필요가 있습니다. 네이버에서 제공하는 IT 강의 서비스인 부스트코스에서 Joe Blitzstein 교수가 진행한 확률론 강의에 한국어 자막을 입혀 제공하고 있습니다. 딱딱한 수식보다는 다양한 비유를 통해 개념적 이해를 확실히 시켜준다는 장점이 있는 강의입니다. 물론 그럼에도 어려운 부분이 적지 않으므로, 적절한 수준에서 이해하고 넘어가시는 걸 추천드립니다.
통계학 개념들을 수학적 차원에서 온전히 이해하고자 하는 것을 목표로 하는 수리통계학 과목입니다. 적절한 난이도를 지녔다고 평가받는 전명식, 송성주 교수의 책을 추천드립니다. 제가 적절한 난이도라고 쓰긴 했지만, 실제로 공부해보시면 난이도가 상당합니다. 뒤에 소개드릴 강의와 함께 공부하시는 걸 추천드립니다. 미적분학을 꼭 먼저 공부하셔야 합니다.
정말 많이 쓰이고 중요도도 높은 통계분석기법인 회귀분석을 공부할 수 있는 교재입니다. 회귀분석을 공부할 수 있는 다양한 교재들이 있습니다만, 이 책은 실용서 수준의 회귀분석 책들보다는 확실히 난도가 있습니다. 이 역시 뒤에 소개드릴 강의와 함께 공부하시는 걸 추천드립니다. 선형대수학을 꼭 먼저 공부하셔야 합니다.
수리통계학과 회귀분석의 경우에는 강의가 그렇게 많지는 않습니다. 당연히 좋은 강의는 더더욱 찾아보기 힘듭니다. KOCW에 공개되어 있는 김충락 교수의 강의들이 강의력이 뛰어나기로 유명합니다. 두 과목 다 독학은 쉽지 않으므로, 가능하시다면 강의와 함께 독학하시는 걸 권해드립니다. 물론 강의를 들어도 쉽지는 않습니다만, 이 과목들까지 학습하신다면 학부 수준의 통계학 지식을 갖췄다고 볼 수 있습니다.
제가 직접 활용했거나 익히 들어온 책과 강의를 소개해드렸습니다. 여러분들의 독학에 도움이 되었으면 좋겠습니다. 서문에서도 말씀드렸지만, 처음부터 완벽하게 하는 것보다 포기하지 않는 것이 훨씬 중요합니다. 여러분이 원하시는 그 무엇이든 이루시기를 응원합니다!