인공지능이 아니라 데이터를 활용하여 어떤 현상을 조사하고 이해하는 틀
튜링상을 수상한 짐 그레이는 과학이 네번째 패러다임을 맞고 있다 주장한 바 있다. 과학의 패러다임은 4번의 패러다임으로 표현되는데, 실험과학, 이론과학, 계산 과학, 그리고 마지막으로 데이터 과학이다.
하나씩 살펴보면 보면, 어떤 현상을 조사하고 이해하는 과학에서 실험 도구를 사용하여 현상을 관찰하는 실험과학, 그리고 수학적 도구를 사용하여 모델링하고 추상화하는 이론 과학, 컴퓨터라는 도구를 사용하는 계산 과학, 마지막으로는 데이터라는 도구를 사용하는 데이터 과학으로 분류된다.
1. 실험 과학 → 실험 도구를 사용하는 과학
2. 이론 과학 → 수학적 도구를 사용하여 모델링/추상화하는 과학
3. 계산 과학 → 컴퓨터라는 도구를 사용하는 과학
4. 데이터 과학 → 데이터라는 도구를 사용하는 과학
예전에 아프리카TV 소속 개발자 한 분이 지하철에서 내릴 것 같은 사람들의 특징을 관찰하고 데이터 수집하여 예측 모델을 만들어 앉아가기 실패한 사례를 컨퍼런스에서 발표 한 적이 있다. 이렇게 데이터 중심으로 어떤 현상을 조사하고 원리와 규칙을 발견하는 행위가 바로 데이터 과학이다.
우리가 흔히 데이터 과학자 이러면, 빅 데이터를 다루거나 인공지능이나 기계학습 알고리즘 따위를 코딩하는 것으로 생각하는데, 조금 더 근본적으로는 그냥 과학 패러다임이며 데이터를 활용하여 어떤 현상을 조사하고 이해하는 틀이라고 생각해야 한다.
가령 고객을 이해하려는 과정에 있는 마케터는 마케팅 사이언스를 하고 있는 것인데, 과학적 사고에 약하다면 성장하기 어렵다. 엔지니어 또한 수학적 과학적 사고가 부족하면 조건 연산 정도의 코드 부채를 양산하게 된다.
어떻게 역량을 키울 수 있을까. 패스트캠퍼스 Red 강연에서 다루려고 준비하고 있다 (돈 내고 보셔야..)