brunch

You can make anything
by writing

C.S.Lewis

by 명준 Jun 24. 2022

무슨 차이지?: 머신러닝, AI, 데이터 사이언스

처음 공부할 때 가장 궁금했던 것이 데이터 사이언스, 머신러닝, AI의 차이였습니다. 학습할 때는 이 셋의 경계가 모호해지는 경우가 많기 때문입니다.


하지만, 이 분야의 전문가들은 항상 세 단어를 상황에 따라 구분해서 사용하곤 합니다. 이에 대해서 이해하기 쉽게 풀어서 설명해놓은 자료가 있어서 정리해드립니다.


Stack Overflow 데이터 사이언티스트 David Robinson의 "What's the difference between data science, machine learning, and artificial intelligence?" 글을 정리한 내용입니다.



직관적 구분


간단히 세 가지를 구분하면 다음과 같습니다.


데이터 사이언스로부터는 인사이트를 얻을 수 있고, 머신러닝으로부터는 예측을 얻을 수 있으며, AI로부터는 행동을 얻을 수 있다.



데이터 사이언스

데이터 사이언스로부터는 인사이트를 얻을 수 있다.


데이터 사이언스의 가장 큰 특징은 '사람'이 있다는 것입니다. 사용 기술이 복잡하든 단순하든 데이터 사이언스에는 항상 사람이 있습니다. 누군가는 통찰을 하고, 해석하고, 결론을 짓는다는 것입니다.


그래서 데이터 사이언스에서 강조하는 것은 다음과 같습니다.


통계적 추론, 데이터 시각화, 실험 설계, 도메인 지식, 의사소통



머신러닝

머신러닝으로부터는 예측을 얻을 수 있다.


머신러닝은 X가 주어졌을 때 Y를 예측하는 일입니다. 보통은 데이터 사이언스와 이용 도구가 겹치는 경우가 많습니다.


예를 들어, 로지스틱 회귀를 사용한다고 해도 이로부터 인사이트를 얻을 수도 있고 예측을 할 수도 있기 때문입니다.


그래서 보통 데이터 사이언티스트들은 머신러닝을 같이 이용하곤 합니다.



AI

AI로부터는 행동을 얻을 수 있다.


AI의 정의는 자율적인 무언가가 작업 시행을 권장하거나 직접 행동하는 것입니다.


보통 AI가 포함하는 것은 다음과 같습니다.


게임 플레이 알고리즘(알파고), 로봇 공학 및 제어 이론, 최적화(Google 지도), 챗봇, 강화 학습



Summary


세 가지를 모두 사용하는 경우를 상상해 봅시다. 자율주행차의 정지신호에 대한 문제를 연구하고 있습니다.


[머신러닝]

수백만 장의 길 사진을 데이터 셋으로 구성하고 정지신호가 있는지를 예측하는 알고리즘을 만듭니다.


[AI]

정지신호를 인식하게 되면 브레이크를 밟아야 할 시점을 정합니다. 다양한 도로조건과 주변 상황에 따라

판단을 합니다.


[데이터 사이언스]

실험을 해보니 일출 전이나 일몰 후에는 정지신호를 많이 놓친다는 것을 판별해냈습니다. 수치상으로는 드러나지 않았지만 사람이 판별해 낸 것입니다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari