brunch

카이스트 AI 대학원에서는 왜 ‘수학’을 강조할까?

by DataSopher
카이스트 AI 대학원에서는 왜 ‘수학’을 그렇게 강조할까?.png





실무자와 연구자 모두에게 필요한 이유

AI의 시대 왜 아직도 수학을 배워야 할까?





“모델이 잘 안 돼요.”

그 순간 얼마나 ‘설명 가능한 언어’를 갖고 있을까요?





요즘 AI 관련 자주 하는 대화가 있습니다.

“모델은 있는데 왜 안 되는지 설명할 수 있는 사람이 없다”




최근 KAIST AI 대학원 커리큘럼을 찬찬히 들여다봤습니다.

수학 중심이었습니다.





ML·DL과 함께


수학 for AI: 선형대수, 다변수 미분, 확률이론, 복잡도 이론

최적화 for AI: 실제 모델이 수렴하지 않는 이유를 수학적으로 추적

ML Theory: 컴퓨팅 복잡도, 성능 보장, 통계적 추론

DL Theory: 딥러닝이 과적합을 피해가는 이유를 이론으로 설명

고급 DL Theory: optimization의 불안정성과 “edge of stability” 이론까지

수리해석(Mathematical Analysis): 힐베르트 공간에서의 선형 연산자 이론




한 마디로 정리하면 이렇습니다.


“실무를 하려면 구현을 배워야 하고 시스템을 만들려면 이론을 배워야 한다.”










이게 왜 중요할가요? (실제 사례로 살펴봅니다)



카이스트의 논문도 살펴봤습니다.


PF3plat (ICML 2025) 같은 3D Gaussian Splatting 기법, Visual Persona (CVPR 2025) 같은 멀티모달 생성 모델들은 수학적 근거 없이 블랙박스로 접근하면 제품화조차 어려운 기술입니다.





왜냐면,


파라미터 수억 개, 수백 GB의 모델이 왜 학습이 안 되는지를 최적화 관점에서 풀어야 하고 생성된 결과물이 신뢰할 만한지를 일반화 이론으로 설명해야 하며 어떤 조건에서 모델이 학습 가능/불가능한지를 수치해석 관점에서 말해야 하기 때문이죠.





비즈니스의 리스크와 직결된 이야기입니다.


“모델을 잘 만든다”보다 중요한 질문은 뭘까요?



❓모델이 왜 작동하는가?
❓언제 실패할 수 있는가?
❓그걸 어떻게 정량화하고 설명할 수 있는가?





이 세 가지 질문에 답할 수 있어야 실리콘밸리에서 말하는 “Tech Lead”,

한국에서는 “리서치 엔지니어 또는 AI PM”이 될 수 있습니다.



카이스트 AI 대학원이 수학을 중심에 둔 이유는 단지 이론을 위한 이론이 아니라 불확실성을 견디는 실무를 위한 기초 체력을 길러주기 위함입니다.






제가 얻은 인사이트


AI 시대에 진짜 차별화되는 인재는 모델을 ‘만드는’ 사람이 아니라

모델을 ‘이해하고 설명하는’ 사람으로 보입니다.


저 역시 데이터분석가로서 늘 수학과 씨름해 왔지만 카이스트의 이 커리큘럼을 보며 배운 점은 “내가 만든 모델을 설명할 수 없다면 그건 운 좋은 결과일 뿐이다.”




여러분이 현업에서 겪은 "모델 설명"의 딜레마는 어떤 게 있었나요?

예를 들어 모델이 성능은 잘 나오는데 왜 그런지 아무도 설명하지 못했던 순간 그때 어떤 선택을 하셨나요?






카이스트 AI 대학원 링크 : https://gsai.kaist.ac.kr/academics/


keyword
작가의 이전글대한민국의 AI·빅데이터가 느린 진짜 이유