brunch

You can make anything
by writing

C.S.Lewis

by 선한인공지능연구소 Jun 12. 2020

머신러닝이란?



인공지능, 머신러닝, 딥러닝 3가지를 가장 잘 표현한 그림입니다.

인공지능 ⊃ 머신러닝 ⊃ 딥러닝 

여러분들이 보고 계신 것처럼 가장 큰 범주가 바로 인공지능입니다.

인공지능이라는 가장 큰 범주 안에 머신러닝이라는 방법이 있고 그 머신러닝을 구현하는 다양한 방법론

중의 하나가 딥러닝입니다.

그래서 위 세 가지는 같은 것이라기보다는 상관관계가 있다고 보시면 올바른 인식이 될 수 있습니다.

각각에 대해서 조금 더 설명해 드릴게요.

인공지능은 기계 또는 컴퓨터가 인간의 지능을 모방하는 기술을 의미합니다.

인공지능을 구현하게 위해서 머신러닝이라는 분야가 생겨나게 되었습니다.

컴퓨터가 데이터를 이용해서 학습을 하는 알고리즘이고요.

이 안에 머신러닝을 구현하는 굉장히 다양한 방법론이 존재하고 있습니다.

그중에 하나가 딥러닝으로 빅데이터를 학습해서 사물을 인식하거나 감정을 분석하기도 하며 음성을 인식하는데 최근에 굉장히 뛰어난 활약을 펼치고 있는 기술이죠.

그래서 이 세 가지는 좀 비슷하긴 하지만 각각이 의미하는 건 정확하게

보면은 다르기 때문에 각각을 잘 알고 용어를 사용하시는 게 좋고요. 여러분들이 공부를 하실 때도 내가 정말 찾고 싶은 게 무엇인지, 알고 싶은 게 어떤 것인지 그 단어를 명확하게 하고 앞으로도 공부를 해 나가시는 게 좋을 것입니다.

우선 머신러닝에 대해서 알아보도록 하겠습니다.

인공지능은 사람과 비슷하게 무언가를 만드는 기술이고 머신러닝은 기계가 사람처럼 학습을 하게 만드는 것입니다. 그래서 머신러닝은 기계학습이라고 불리기도 합니다.

과거에는 인공지능을 개발할 때 해당 분야의 전문가들이 만든 많은 양의 샘플들을 데이터베이스화하여 자료들을 일일이 수작업으로 컴퓨터에 직접 등록하는 방법을 사용했습니다. 

하지만 이러한 방법은 대부분의 작업이 사람의 손을 거쳐야 하므로 필연적으로 많은 노력과 비용이 발생하게 됩니다.

또한, 시대가 발전함에 따라 사람조차 명확하게 구분할 수 없는 지식(no explicit knowledge)을 구현해야 하거나, 사람이 일일이 구현하기에는 너무 많은 양의 규칙들이 필요한 경우가 생겨나기 시작합니다. 

이러한 경우에 사용할 수 있도록 고안된 방법이 바로 머신러닝(Machine Learning)입니다.

기계학습이라고도 불리는 머신러닝은 컴퓨터를 인간처럼 학습시킴으로써 인간의 도움 없이 컴퓨터가 스스로 새로운 규칙을 생성할 수 있지 않을까 하는 발상으로부터 시작되었습니다.


학습에서 가장 중요한 건 바로 데이터입니다.

우리도 다양한 책이나 아니면 지금까지 경험 그런 것들을 통해서 계속 성장하고 지능이 발달되는 것처럼 머신 러닝에서도 데이터를 통해서 기계가 학습을 하게 됩니다.

그러면 이 머신 러닝이 지금까지 나왔던 컴퓨터 사이언스와는 어떻게 다를까요?

기존에는 어떤 입력값을 줄 때 그와 동시에 우리는 이 입력 값으로 무엇을 할 건지 알고리즘을 함께 제공합니다.

그러면 컴퓨터에서 이 작업을 수행해서 최종 출력 값! 아웃풋을 인간에게 주게 되죠.

그것이 우리가 지금까지 늘 해온 방식의 컴퓨터 사이언스입니다.

이에 반해서 머신러닝은 입력은 똑같이 주지만 알고리즘을 주는 게 아니라 출력 값을 컴퓨터에게 같이 보여주게 됩니다. 그러면서 구하고자 하는 건 바로 알고리즘이 되는 거죠.

어떤 차이가 있는지 좀 보이시나요?

 예를 볼게요!

1과 2를 입력해서 더하기를 하라고 컴퓨터에게 명령하면 3이라는 결괏값을 우리에게 출력합니다.

하지만 머신러닝에서는 조금 다른데 똑같이 인풋으로 1과 2가 들어갑니다.

하지만 더라기를 제공하는 게 아니라 결괏값이 없던 숫자 3을 함께 주는 거죠.

그러면 이제 컴퓨터는 1과 2 사이에서 내부적으로 무슨 일이 있었는지 학습을 하고 '더하기'라는 알고리즘을 우리에게 보여주는 방식입니다.

어떻게 머신러닝이 입력값과 출력 값을 보고 알고리즘을 만들 수 있었을까요?

그 비밀은 바로 데이터입니다.

어떤 값을 넣었는데 무엇이 나온다는 것은 컴퓨터 내부에서 어떤 일이 일어나게 될 것이냐 하는 것을 여러 개를 보여주면 컴퓨터가 내부적으로 무슨 일이 일어나 누구나 하는 걸 파악을 할 수 있게 되는 것입니다.

그래서 머신러닝에서는 데이터가 필수 조건이고요.

데이터가 없이 머신러닝 한다는 것은 식자재 없이 요리하는 것과 비슷합니다.

여러분들도 머신러닝 하고 싶다 하면 데이터가 먼저 준비가 되어 있어야 하는 것을 기억해두시길 바랍니다.


기존의 컴퓨터 사이언스가  하고 있었는데 데이터가 많이 필요한 머신러닝이 왜 필요하게 되었는지 필요성에 대한 이야기를 한번 해볼게요.

기존의 컴퓨터 사이언스로 강아지의 이미지를 판별하는 알고리즘을 만들어 본다고 생각을 해볼게요.

그러면 일단 강아지 얼굴은 세모이고 눈이 두 개고 귀가 쳐져있고 다리가 있는 이러한 특징을 강아지 이미지를 통해 뽑아낼 수 있을 거예요.

그러면 강아지 형태의 마스크를 하나 만들 수 있겠죠. 

이 형태를 가지고 다른 동물들 사진에 비교해가면서 일치하면 강아지 아니면 강아지가 아니다로 판단할 수 있을 거예요.

기존에 컴퓨터 사이언스도 잘해왔지만 강아지가 귀가 크거라 털이 많아서 문제가 생기는 경우가 발생합니다.

이럴 때 필요한 기술이 바로 머신러닝입니다.

세상에 존재하는 다양한 강아지 이미지를 학습을 하는 거예요. 그러면 컴퓨터가 다양한 강아지의 모습을 보면서 스스로 판단을 하게 되는 거죠.

이렇게 학습을 하고 나면 컴퓨터가 옷을 입은 강아지를 봐도 정확도 높게 판별을 할 수 있게 됩니다.

머신러닝의 동작 방식은 일반적으로 다음과 같은 순서대로 동작합니다. 

1. 일정량 이상의 샘플 데이터를 입력한다.

2. 입력받은 데이터를 분석하여 일정한 패턴과 규칙을 찾아낸다.

3. 찾아낸 패턴과 규칙을 가지고 의사결정 및 예측 등을 수행한다. 

따라서 머신러닝을 한마디로 정의하자면 수많은 데이터를 학습하여 일정한 패턴을 찾아내고 그것을 활용하는 행위라고 할 수 있습니다.

더 현실적으로는 의학, 금융, 교육분야 등에서 활발히 사용되고 있는 머신러닝입니다.


머신러닝이 처음이라 익숙하지 않을 수 있지만 이것만은 기억해두세요!

컴퓨터가 학습을 한다는 개념이고 기존의 컴퓨터 사이언스와 어떤 점이 다른지 그리고 왜 최근에 더 많이 필요하게 되었는지 그런 것들을 이해하시면 그 이후에 학습을 하시는데 도움이 되실 거예요.

머신러닝의 핵심은 '데이터'입니다.

이후 시간에는 머신러닝에 어떤 종류가 있는지?

머신러닝로 어떤 문제들을 해결할 수 있는지에 대해서 알아보는 시간을 갖도록 하겠습니다.


작가의 이전글 인공지능 역사 
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari