선생님 없이 아이도 인공지능도 "학습은" 한다

인공지능과 아이의 비지도학습(unsupervised leanring)

Jul 3. 2023

한국 나이로 4살에서 얼마 전 2살로 바뀐, 30개월 우리 아들은 혼자서도 잘 논다. 엄마, 아빠가 바쁜 것 같으면 혼자서 죽치고 앉아 책도 진득하게 보고, 블록을 가지고 노는 것도 좋아한다. 츄피(T'choupi) 책을 붙잡으면 전집을 다 볼 때까지 앉아서 책을 넘기고 있고, 블록을 잡으면 집을 만든다고 하면서 뚝딱뚝딱하고 있다. 그러던 어느 날. 혼자서 블록을 가지고 노는 것 같더니 갑자기 좋아하며 손뼉 치는 소리가 들린다. 궁금해서 뭘 하고 있나 슬쩍 봤더니, 아래 사진처럼 같은 모양, 같은 색깔의 블록을 모아놓고 혼자 뿌듯해하고 있었던 것이다.

같은 모양과 같은 색깔의 블록을 군집화한 모습

지금은 색깔 구분은 물론 색깔의 이름, 가령 파란색, 초록색과 같이 이름도 잘 맞추지만, 위 사진처럼 블록을 모은 두어 달 전만 해도 아직 우리 아들은 색깔의 이름과 색깔을 잘 맞추지 못하였다. 빨간색을 보고 파란색, 초록색을 보고 노란색이라고 하는 경우가 더 많았다. 위와 같은 놀이를 하던 당시만 해도 아직 저 블록들의 색깔이 무엇인지는 모르지만, 우리 아들은 같은 색깔, 같은 모양의 블록을 같은 색깔의 원 고리에 모아놓고는 좋아하고 있었다. 비슷한 특성을 가진 것들만 하나의 군집, 다른 말로 클러스터(cluster)로 만들어 놓고 좋아하던 우리 아들. 누가 알려주지 않아도 혼자서 스스로 인공지능에서 비지도학습(unsupervised learning)이라 불리는 학습법을 하고 있었던 것이다.

지난 글들에서 아이도, 인공지능도 선생님이 옆에서 알려주는 지도학습(supervised learning)을 한다는 것을 살펴보았다. 어떻게 하면 지도학습을 잘할 수 있는지에 대해서도 논한 바 있다. (궁금하신 분들은 매거진 지난 글들 참고) 아이나 어린이들을 학습시킬 때 옆에서 방향을 안내해 줄 부모나 선생님이 계시듯이, 인공지능 역시 전문가가 지도를 해준 상태에서 학습을 하게 된다. 우리는 이러한 학습방법을 지도학습이라고 부르며, 현재 다수의 인공지능은 지도학습을 기반으로 딥러닝 알고리즘을 사용하고 있다.

하지만 아이도 혼자서 스스로 무언가를 학습하는 것처럼 인공지능 역시 스스로 학습해야 할 때가 있다. 전문가가 부재하거나, 전문가가 데이터에 라벨링(labeling) 하기 어려운 경우 등 현실적인 문제로 지도학습을 쓰기 어려운 경우. 대안으로 비지도학습을 통해 인공지능을 학습시키기도 한다. 아래 예를 살펴보자.

지도학습과 비지도학습

지도학습은 앞서 말한 바와 같이 선생님 역할을 하는 전문가가 있다. 전문가가 강아지, 고양이, 토끼 사진을 잔뜩 구한 후, 하나하나 사진에 이름표, 레이블(label)을 붙인다. 그러면 인공지능은 이름표가 붙은 강아지, 고양이, 토끼 사진을 학습하여 분류 모델을 만들게 된다. 이 분류 모델은 강아지는 동글동글 귀여움, 고양이는 새침하고 날카로움, 토끼는 귀가 쫑긋쫑긋과 같은 특성(feature)을 기반으로 동물을 분류하게 된다. 새로운 동물 사진이 입력이 되면 지도학습으로 학습한 분류 모델을 기반으로 동물 사진을 분류하게 된다. 귀가 길쭉한 사진이 들어오면 토끼, 동글동글 귀여운 사진이 들어오면 강아지로 분류하는 것처럼.

비지도학습은 지도학습과 달리 인공지능이 학습하는 데이터에 레이블이 없다. 레이블을 붙일 전문가가 부재했거나 전문가를 초빙할 비용이 너무 비쌌거나 등 다양한 이유로 비지도학습을 수행하게 된다. 비지도학습은 옆에서 알려주는 선생님 없이, 이름 그대로 지도 없이 인공지능 스스로 학습을 한다. 그래서 인공지능은 자신이 구분하는 동물이 무슨 이름을 가지고 있는지는 절대 모른다. 다만 속성이 유사한 동물들을 동일한 군집, 동일한 클러스터로 군집화할 뿐이다.

비지도학습의 과정이 우리 아들이 혼자 블록 놀이한 것과 정말 유사하지 않은가? 인공지능이 토끼, 강아지, 고양이의 이름은 모르면서 비슷한 동물들끼리 군집으로 묶었듯이, 우리 아들 역시 블록이 무슨 색인지도 모르면서 비슷한 블록을 하나의 군집으로 묶은 것이다. 이렇듯 비지도학습은 옆에서 누가 알려주지 않아도 스스로 학습을 하여 비슷한 속성을 가진 것들을 군집화한다는 특성이 있다.

그렇다면 인공지능에서 비지도학습은 언제 가장 많이 활용이 될까? 대표적인 곳은 추천 시스템(recommend system)이다. 우리가 즐겨보는 넷플릭스, 유튜브 등의 애플리케이션은 추천 알고리즘을 통해 우리가 시청하면 좋을 콘텐츠를 추천해 준다. 추천 알고리즘의 일종인 협업 필터링은 사용자에게 콘텐츠를 추천하기 위해 비슷한 성향을 보인 다른 사용자가 어떤 콘텐츠를 좋아했는지를 활용한다. 비슷한 사용자를 하나의 군집으로 묶어 놓고 같은 군집에 속한 사람들에게는 같은 콘텐츠를 추천해 주는 것이다. 또 다른 추천 알고리즘인 콘텐츠 기반 필터링은 유사한 콘텐츠를 하나의 군집으로 묶어 놓고, 유사 콘텐츠를 하나 시청한 사용자에게 동일 군집의 다른 유사 콘텐츠를 추천해 준다. 추천 알고리즘에서 활용되는 필터링 기법을 세부적으로 들여다보면 좀 더 복잡하긴 하지만 본질은 유사한 속성을 가진 녀석들을 하나의 군집으로 묶어 준다는 것이다. 바로 비지도학습을 기반으로 하고 있다는 것이다.

추천 시스템이 활용하는 알고리즘 (출처 하단 명기)

추천시스템과 같은 영역에서는 비지도학습이 필수적이다. 하지만 추천시스템과 같이 일부 영역을 제외하고는 인공지능은 지도학습을 더 선호하는 경향이 있다. 마치 우리가 아이 혼자 자습을 하는 것보다 옆에 선생님과 같이 학습을 하는 것을 더 선호하듯이. 혼자 스스로 학습하는 게 좋은 걸 알면서도 우리는 아이가 학교, 학원, 과외 등 선생님을 통해 학습하는 것을 더 선호한다. 인공지능도 마찬가지다. 비지도학습이 가지고 있는 장점이 있음에도 지도학습을 할 수 있으면 지도학습을 더 선호한다. 우리가 아는 아이가 혼자 학습을 할 때 발생하는 어려움이 인공지능의 비지도학습에서도 유사하게 발생하게 된다.

비지도학습, 혼자 스스로 학습을 하게 되면 어떤 어려운 점이 있는지, 스스로 하는 학습에서 유의해야 할 점은 무엇인지에 대해서는 다음 글에서 살펴보도록 하겠다.

이미지 출처

https://www.chosun.com/economy/tech_it/2021/01/01/IYRYZY6L45GVFB6IUKDDGDRLHY/

keyword

Brunch Book

이전 05화인공지능도 과외를 받는 세상토성이 훌라후프를 돌리는 이유?다음 07화