인공지능도 아기도 학습은 어렵다.
인공지능에게도 아이에게도 학습은 어렵다
학습(learning)이란 무엇인가? 교육학에서 학습은 "연습이나 경험의 결과 일어나는 행동의 지속적인 변화"라고 정의하고 있다. 인공지능에서 학습은 보다 복잡한 정의를 나타낸다. 인공지능 분야 중 학습이 가장 많이 활용되는 머신러닝(machine learnig)에서 학습은 훈련 데이터(training data)의 패턴을 익혀 모델링을 하여 추후 활용될 예측, 분류 등을 수행하는 밑바탕이 되는 것을 의미한다.
아이를 학습시키는 것도, 인공지능을 학습시키는 것도 정의에 있어 조금의 차이는 있지만 유사성을 보이는 점도 많다. 우선 아이와 인공지능 모두 학습 데이터가 필수이고, 인공지능에서 널리 활용되는 지도학습(supervised learnig)의 경우 아이와 마찬가지로 옆에서 지도해 줄 선생님 혹은 전문가의 존재 역시 필수이다. 학습 데이터와 선생님이 준비가 되면 아이는 자신만의 사고 과정으로, 인공지능은 자신만의 알고리즘(머신러닝, 딥러닝 등)을 통해 학습 모델을 만드는 것이다. 이렇게 만들어진 학습 모델은 아이도 그리고 인공지능도 다양한 방면으로 활용할 수 있게 된다. 지난 글에서는 인공지능 지도학습에서 배워볼 수 있는 육아법에 대해 알아보았다.
오늘은 인공지능의 학습, 특히 지도학습에서 어려운 요소들을 살펴보며, 우리가 아이를 키우는데 반면교사로 삼아야 할 부분은 없는지 살펴보겠다.
지도학습을 성공시키기 위해 가장 필수적인 요소는 양질의 데이터이며, 데이터에 적합한 레이블(label)을 붙이는 라벨링(labeling) 혹은 어노테이션(annotation)을 성공적으로 수행해 줄 전문가의 존재 역시 필수이다. 반대로 이야기하자면, 지도학습을 실패하는 경우 데이터 확보에 실패했거나, 라벨링 작업이 원활하지 않아서인 경우가 많다.
아이를 육아, 아이를 학습시키는 것도 마찬가지다. 양질의 학습 자료를 제공하지 않으면 아이의 학습 방향은 엇나갈 수 있다. 다양한 책으로 육아를 한 경우와 유튜브로 육아를 한 경우의 차이를 생각하면 쉽게 이해할 수 있을 것이다. 그리고 지도학습에서 지도를 해줄 전문가가 중요하듯, 아이의 육아 역시 지도를 해줄 부모와 선생님 존재가 중요하다. 부모와 선생님이 방향을 잡아주지 못해 엇나가는 경우를 우리는 주변에서 쉽게 볼 수 있다.
오늘은 새로운 사례를 통해 지도학습의 어려움을 얘기해보고자 한다.
순진한 강아지의 표정과 대비되는 헬 게이트가 열린 집안의 모습이 인상적인 사진이다. 마치 옛날 TV 만화 '그랑죠'에 나오는 마법진 같지 않은가? 강아지의 똥으로 인해 발생한 마법진 사태! 이는 로봇청소기에 탑재된 인공지능이 강아지 똥을 인식하지 못하여 벌어진 사태이다. 로봇청소기는 강아지 똥을 인식을 하고 이를 피해 가도록 설계가 되어야 하는데, 로봇청소기의 인공지능은 아직 강아지 똥을 학습하지 못해서 강아지똥을 밟고 지나가게 되었고, 멋진 마법진이 완성이 된 것이다. 우리는 강아지 똥 마법진 사진을 보며 웃고 넘어가지만 로봇청소기 제조회사 입장에서는 반드시 해결해야 할 문제였다. 실제로 국내 로봇청소기 제조회사에서 긴급으로 패치를 내며 해결을 한 문제이기도 하다.
당시 로봇청소기 제조회사는 강아지 똥을 피하기 위해 탑재된 인공지능을 업그레이드시키기로 한다. 하지만 두 가지 문제에 바로 봉착하였다. 먼저, 강아지 똥을 피하기 위해서는 로봇청소기가 무엇이 강아지 똥이고 무엇이 강아지 똥이 아닌지 학습을 해야 한다. 이를 위해서는 강아지 똥 사진이 수천만 장 필요하다. 이 수많은 강아지 똥 사진을 어디에서 구해야 할까? 두 번째 문제는 강아지 똥 사진을 구했다고 하더라도 이건 강아지똥이야, 이건 강아지 똥 아니야라고 지도를 해 줄, 정확하게는 똥 사진에 레이블을 붙여줄 인력이 필요했다. 레이블링 작업 하나하나가 비용으로 나가게 되는데 수천만장을 레이블링 한다고 하면 그 비용 역시 어마어마할 것이다. 해당 업체는 국내 레이블링 회사들을 알았지만 상상 이상의 견적을 받았다고 한다. 그래서 비교적 저가인 중국 레이블링 회사를 알아본다고 하였다. 잘 레이블링 된 강아지 똥 사진들을 확보하기만 하면 이를 피하게 하는 건 현재 인공지능 기술로 어렵지 않다. 정작 허들이 되는 것은 앞 단계인 데이터 확보 및 사람의 레이블링 작업이었던 것이다. (당시 회의에서 고양이 똥은 어떻게 피해야 하나요라는 소수 의견도 있었다고 한다 ㅎㅎ)
로봇청소기와 강아지의 합작 마법진 사진은 인공지능 수업 중 첫 번째 강의에서 주로 활용을 한다. 과거 수업에서는 해당 사례를 이야기하며 인공지능 솔루션 만들기가 쉽지만은 않다는 것을 강조하는 것에서 끝이 났는데, 최근에는 저 사진을 볼 때마다 아직 배변 훈련 중인 우리 집 30개월 아들이 오버랩이 된다.
아이들 배변 훈련은 쉽지만은 않다. 우리 아들의 경우 두 돌이 지나고부터는 본격적인 배변 훈련에 들어간 것 같다. 그 결과 현재 소변의 경우 본인만의 변기에 하는 경우가 많다. 아침에는 일어나자마자 먼저 변기 앞에 가서 서 있다. 아직 바지와 기저귀를 내리는 법을 몰라 서있는 상태로 기저귀에 소변을 본 적도 있다.
하지만 대변은 정말 쉽지 않다. 아직 변기에 앉아 대변보는 게 많이 어색해서인지, 변기를 거부하며 기저귀에 대변을 보는 경우가 거의 대부분이다. 아직 30개월이면 대변을 못 가리는 아이가 많은 개월 수이기도 하기에 그리 조급하게 배변훈련을 시키고 있진 않다. 올해 안에만 마무리해서 내년에 유치원을 가게 된다면 기저귀를 떼게 하고 싶을 뿐. 하지만 그래도 원인은 분석해봐야 하지 않을까?
대변을 가리지 못 한 이유는 무엇일까? 앞선 인공지능 학습 사례에 반추해 보자. 먼저 학습 데이터를 잘 모았는가? 우리는 아이 대변 훈련을 위해 말로 행동으로 알려주기도 하고, 다양한 동화책의 사례들도 함께 보여준다. 뽀로로와 같은 좋아하는 캐릭터의 배변 활동이 있는 책들이 많아 함께 읽으며 학습을 하는 것이다. 이렇게 학습 데이터가 나름 잘 갖춰져 있음에도 아직 못하는 것은 지도를 하는 부모가 아직 미숙해서일 가능성이 있다. 나도 와이프도 아이는 처음이니 배변훈련이 쉽지만은 않은 것도 사실이고. 그리고 무엇보다 아직 아이가 받아들일 준비가 되지 않아서일 수도 있고.
최근 아이에게 응가를 변기에서 하면 아이가 좋아하는 젤리를 주겠다는 약속을 했다. 젤리에 혹해서인지 최근에는 그렇게 앉아 있기를 거부하던 변기에 혼자 앉아 있기도 한다. 그렇게 당근을 걸고 배변 훈련을 시작한 지 며칠이 지난 어느 날, 아이가 갑자기 똥 누고 싶다는 이야기를 하며 나에게 왔다. 변기에 앉히는 것도 거부를 안 하더니 나에게 얘기를 한다
"뭐가 나오고 있어"
드디어! 처음으로 변기에 대변을 본 것이다. 너무 신이 난 엄마와 아빠는 환호를 하며 박수를 쳤고 아이도 멋도 모르고 따라서 박수를 치며 좋아했다. 이후 좋아하는 젤리를 먹은 것은 당연한 일. 하지만 안타깝게도 이후 대변을 변기에 한 경우는 없었지만 한 번 성공을 했기에 조금씩 나아지지 않을까 생각을 한다.
여기서 하나 주목해야 할 점은 보상, 아이에게 젤리를 주겠다는 이야기를 하니 그렇게 힘들었던 배변이 성공한 것이다. 최근 인공지능에서도 이와 유사한 학습방법이 널리 활용되고 있다. 바로 강화학습(reinforcement learning)이 그 주인공이다.
강화학습은 인공지능 모델이 학습을 할 때, 성공을 하면 보상을 주고 실패를 하면 벌을 준다. 당근과 채찍을 통해 인공지능이 최적의 길을 찾아가도록 하는 것이 바로 강화학습이다. 강화학습은 단독으로 활용되기보다는 딥러닝 기법과 같이 활용이 되는 경우가 많다. 알파고도 챗GPT도 딥러닝 기법과 함께 강화학습을 함께 활용하고 있다.
역시 인공지능도, 아이도 보상이 있어야 학습을 더 잘할 수 있나 보다.