brunch

You can make anything
by writing

C.S.Lewis

by 최재운 Jul 05. 2023

토성이 훌라후프를 돌리는 이유?

아이도 인공지능도 비지도학습은 쉽지 않다

이제 30개월이 된 우리 아들의 요즘 최애책은 우주와 관련된 그림이 있는 책이다. 책의 이름은 'Spaceblock'. 우주와 관련된 모든 것이 단 한 권의 책이 총망라되어 있는 책으로 아이들 눈높이에 딱 맞아서 정말 강추한다. 태양계부터 달나라, 로켓, 달탐사, 우주정거장까지 그림으로 쉽게 잘 설명이 되어있어, 우리 아들은 페이지 하나하나를 가리키며 이건 뭐냐 저건 뭐냐 물어본다. 아래 사진에 있는 것처럼 태양계 페이지도 즐겨 보는 페이지 중 하나인데, 수성부터 해왕성까지 행성들을 하나하나 가리키며 이름이 무엇인지 물어보고, 자기는 지구에 산다는 것을 안다며 매번 나에게 자랑한다. 아직 우주와 관련된 내용이 아이에겐 어렵기 때문에 (성인들에게도 어렵다) 이 책을 볼 때면 꼭 아빠에게 읽어달라고 한다. 가급적 읽어주려고 하지만 사정상 책을 읽어주기 어려울 때면 혼자서 보면서 조잘조잘 자기가 아는 것들을 얘기하곤 한다. 그렇게 혼자서 책을 보다가 갑자기 신이 나서 외친다.


이거 훌라후프 같아.
얘(토성)하고 얘(천왕성)는 훌라후프 가지고 있어


혼자서 책을 보며 우주를 학습하던 우리 아들은 자기가 아는 세상의 범주에서 학습 과정을 진행하였다. 자기가 알고 있는 중간 즈음에 위치하는 고리는 훌라후프였고, 졸지에 토성과 천왕성은 훌라후프를 돌리는 행성이 된 것이다. 그 광경이 너무 웃기기도 하였고, 또 대견스럽기도 하여 한참을 웃다가 옆에서 내가 "지도"를 해주었다.


아빠 : 이건 훌라후프 같이 생겼네. 하지만 훌라후프가 아니라 행성의 고리야.

윤우 : 고리?? 왜??

아빠 : 토성하고 천왕성은 고리를 가지고 있어.

윤우 : 왜??

아빠 : 행성이 만들어지는 과정에서........


행성 생성 과정에서 잔해물들이 중력에 끌려 고리를 만들었다고 이야기를 해주었지만 이해는 전혀 못한 눈치이다. 하지만 훌라후프와 같은 고리가 있다는 것을 학습하게 된 이후부터는 해당 페이지를 볼 때마다 꼭 손으로 행성 고리를 짚고 넘어간다. 고리라고 이야기 한 다음에 뒤에 꼭 한 문장을 더 붙인다.


"이거 훌라후프 같아!!"


토성과 천왕성은 훌라후프를 가지고 있다??!!


위의 사례에서 알 수 있듯이, 스스로 하는 학습은 어느 방향으로 튈지 모른다는 문제점을 안고 있다. 만약 옆에서 지도해주지 않았다면, 우리 아들은 토성과 천왕성은 훌라후프를 돌린다고 생각했을 것이다. 아이의 학습 사례처럼 인공지능의 비지도학습(unsupervised learning) 역시 학습의 정확도가 떨어진다는 문제점을 안고 있다. 지난 글에서는 인공지능의 비지도학습에 대해 아이의 사례에 빗대어 이야기해 본 바 있다. (최하단 링크 참고) 오늘은 인공지능의 비지도학습에서 배워볼 수 있는 아이 학습 방법에 대해 살펴보겠다.




가장 중요한 건 학습(learning)의 목적


인공지능 분야에서 비지도학습을 쓰는 이유는 크게 두 가지이다. 지도학습을 하기 어려운 상황에서 대안으로 비지도학습을 활용하는 경우와 비지도학습이 정말로 필요한 경우이다. 첫 번째 이유와 관련된 내용은 다음 문단에서 다뤄보기로 하고, 여기에서는 비지도학습이 정말로 필요한 경우에 대해 논해보겠다.


일반적으로는 지도학습을 비지도학습보다 선호한다. 지도학습은 전문가가 정답이 갖추어진 데이터를 기반으로 하기에 정확도가 높다. 그래서 대부분의 경우 지도학습을 우선적으로 고려하지만 비지도학습을 우선 고려하는 상황도 존재한다. 지난 글에서 살펴본 바와 같이 유튜브, 넷플릭스 등의 추천시스템을 활용해야 하는 경우가 바로 이 경우에 해당한다. 학습의 정확도보다는 방향성에 초점을 맞출 경우, 비지도학습이 더 적합한 경우가 인공지능에서도 존재하는 것이다.


아이를 육아하는 것도 마찬가지이다. 혼자서 학습을 해나가며 가끔은 틀려도 좋은 분야에서는 아이를 믿고 혼자 하도록 하는 게 좋다. 혼자서 책을 읽는다거나 혼자서 블록을 만드는 행위들은 옆에서 누군가가 지도를 해주는 것도 좋지만 스스로 하게 하는 것이 지능 발달과 창의력 향상에 좋지 않을까 생각을 한다. 우리 아들도 가끔 블록을 만드는 것을 보면 깜짝 놀랄 때가 많다. 나의 굳은 뇌로는 늘 비슷한 모양의 블록이 완성이 되지만 우리 아들은 기상천외한 방법으로 블록을 만든다. 하루는 아주 높이만 블록을 쌓고는 아파트를 만들었다고 좋아하고, 또 하루는 경사진 형태를 만들고는 미끄럼틀이라고 좋아한다. 이렇듯 스스로 할 수 있는 영역이고 실패가 용인되는 분야라고 한다면 혼자서 학습을 하는 것이 무한한 가능성을 펼칠 수 있다는 점에서 권장할만하다.


다만 비지도학습에서 어려운 점은 잘 유념해야 한다. 앞서 말한 바와 같이 비지도학습의 가장 큰 문제는 정확도이다. 최근 인공지능에서는 비지도학습의 성능 향상을 위한 알고리즘들 개발되고 있다. 과거 비지도학습의 가장 대표적인 기법은 클러스터링(clustering)이었다. 클러스터링 기법은 군집을 만드는데 최적화되어 있어 지금도 널리 활용이 되지만, 정확도가 상대적으로 낫다는 단점이 있다. 그래서 최근에는 정상(normal)이 아닌 비정상(abnormal)을 탐지하는 이상탐지(anomaly detection)에서 활용되는 비지도학습으로는 오토인코더(autoencoder) 방식이 있다. 오토인코더는 딥러닝 기반의 비지도학습 기법으로 인풋과 아웃풋의 차이를 딥러닝 방식으로 학습하여 차이를 구별해 내는 방법이다. 이렇듯 비지도학습의 성능향상을 위해 진화된 알고리즘이 속속 등장하고 있다.


아이 육아에 있어서도 스스로 하는 자율학습이 좋으니 무작정 너 혼자 공부해라고 하는 것은 퍼포먼스가 떨어질 수 있다. 아이가 스스로 학습을 하는 능력을 갖출 때까지는 옆에서 지도를 해주는 것이 필요하다. 인공지능의 비지도학습의 성능을 높이기 위해 진화된 모델이 등장하였듯이, 아이의 학습 역시 아이가 스스로 공부할 수 있는 능력을 갖출 때까지 트레이닝이 필요한 것이다. 앞서 든 예와 같이 혼자서 블록을 만드는 아이 역시 처음부터 블록을 잘 만들 수는 없다. 옆에서 블록은 무엇이며, 어떻게 조립을 할 수 있고, 무엇을 만들 수 있는지 등을 지속적으로 알려줘야 한다. 이렇게 블록을 만드는 모델(model)이 자체 생성된 아이는 비로소 자신의 창의력을 발산하며 놀라운 작품들을 만들게 된다.




중요한 건 역시 균형


추천 시스템, 이상 탐지와 같은 영역에서는 비지도학습이 필수적으로 활용이 된다. 하지만 비지도학습을 어쩔 수 없이 써야 하는 경우도 존재한다. 지도학습을 활용하기가 현실적으로 어려운 경우 비지도학습을 울며 겨자 먹기로 써야 하는 경우도 있는 것이다. 지도학습은 전문가가 정답이 갖추어진 데이터를 완벽하게 준비해야 학습을 할 수 있다. 실제 상황에서는 전문가의 부재, 시간/돈 등 현실적 제약 등으로 인해 완벽하게 준비된 데이터를 마련하는 것이 쉽지 않다.


예를 들어 의학 분야에서는 의료 데이터를 전문가가 라벨링(labeling)하는 것이 비용도 많이 들고 시간도 오래 걸리기 때문에 완벽한 지도학습을 하기 힘든 경우가 많다. 그렇다고 비지도학습을 활용하기에는 정확도가 문제가 된다. 목숨이 달린 의학 분야에서 정확도가 낮은 기법으로 분석을 하는 것은 또 하나의 리스크가 되기 때문이다. 그 결과 등장한 방법이 중도(中道)를 택한 준지도학습(semi-supervised learning)이다.


지도학습, 준지도학습, 비지도학습 (출처 하단 명기)


준지도학습은 정답 데이터를 수집하는 라벨링 과정에서 자연적으로 발생하는 비용과 자원이 많기 때문에 등장을 하였다. 라벨링 된 데이터가 일부 일 때, 이를 기반으로 학습을 하고 레이블이 없는 다수의 데이터에 이를 적용하는 방법이다. 상대적으로 적은 비용과 노력으로 수집한 데이터를 기반으로 하고 있기 때문에 최근 다양한 분야에서 연구가 진행되고 있다.


결국 아이의 육아에서도 이러한 중도의 방식, 균형을 갖춘 학습이 제일 중요하다고 생각된다. 무작정 선생님이 다 알려주는 지도학습도, 아이가 완전히 혼자 알아서 하는 비지도학습도 장단점이 있겠지만, 일부는 선생님이 알려주고 이를 기반으로 아이가 스스로 학습하는 준지도학습이야 말로 가장 효과적이면서 또 보편화된 교육 방식이 아닐까?


준지도학습 역시 단점이 많다. 가장 중요한 건 준지도학습에서 활용이 되는 소수의 정답 데이터, 전문가가 라벨링한 정답 데이터가 집단을 대표해야 한다. 그렇지 않으면 학습은 편향이 발생할 수밖에 없다. 우리가 아이를 가르치는 것도 마찬가지이다. 우리가 알려주는 일부의 내용들이 아이의 뇌에서 확산 과정을 거치게 될 텐데 인풋이 잘못되면 아이의 뇌는 편향이 된 상태로 스스로 학습을 하게 된다. 결국 부모든 선생님이든 어떤 지도를 하는지에 따라 결과는 천차만별이 될 수 있는 것이다. 특히나 유아는 부모의 영향이 절대적이기에 아이를 어떤 방향으로 학습시키는지에 따라 어떻게 성장해 나갈지가 결정이 된다. 쉽지 않은 결론이지만 오늘도 부모 역할의 중요성을 다시 한번 생각해 보며, 모든 부모님들에게 응원의 마음을 전해본다.




사진출처 : https://blog.est.ai/2020/11/ssl/

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari