brunch

You can make anything
by writing

C.S.Lewis

by 최재운 Jul 24. 2023

인공지능도 과외를 받는 세상

우리 아이에게 과외는 필요할까?

주말이 되면 아들과 놀아주기도 하지만, 엄마와 아빠는 서재에서 노트북으로 작업을 하는 경우도 꽤 있다. 그럴 때마다 엄마 아빠의 일거수일투족이 궁금한 우리 아들은 뭐하는지 물어보곤 한다. 그러면 공부를 한다고 대답을 해주곤 했다. 그렇게 몇 주, 몇 달의 시간이 흐른 어느 날. 숫자 세는 법을 놀이로 알려주기 위해 무심코 아들에게 숫자 공부하자고 말을 했더니 돌아오는 대답.


나는 공부하려면 더 커야 해. 커서 공부할 거야


아직 공부가 뭔지는 모르지만 엄마, 아빠가 하는 것이 공부라서 자기는 아직 공부할 나이가 안 되었다고 생각하는 드디어 31개월이 된 우리 아들. 여느 아이들과 마찬가지로 어린이집을 다니고 그 외 시간은 열심히 노는데 할애하고 있다. 하지만 벌써부터 주변을 잠식하고 있는 사교육의 그림자를 보게 되면 마음이 조급해지기도 한다. 조리원에서 알게 된 친구는 몬x소리 수업을 통해 숫자를 벌써 30까지 셀 줄 안다는 자랑 섞인 이야기가 들린다. 어린이집 친구는 어린이집을 마치고 놀이로 한글을 배우는 학원을 다닌다고 한다. 게다가 내년이면 예전 우리나라 나이로 5살이 되기 때문에 유치원에 대한 고민도 가중되고 있다. 누구나 한 번쯤 고민하게 되는 영어유치원을 보내야 하나 말아야 하는 고민을 해결하기 위해 여기저기 조언을 구해보면 더 머리만 아파지는 요즘이다.


사교육처럼 사람이 옆에서 학습을 직접적으로 도와주는 것은 인간의 세계에서만 발생할 것이라 생각하는 경우가 많을 것이다. 하지만 인공지능을 학습하는 데 있어서도 과외선생님처럼 인공지능 옆에서 학습을 도와주는 경우가 꽤 많다. 오늘은 챗GPT를 비롯한 다수의 인공지능이 받는 과외에 대해 알아보자.




챗GPT가 기존의 챗봇과 달리 선풍적인 인기를 끌면서, 동시에 두려움까지 불러일으켰던 것은 진짜 사람과 대화한다는 느낌이 들었기 때문이다. 게다가 사람처럼 말을 하면서 명석하기까지 한 챗GPT의 학습 비결 중 하나는 인공지능이 사람들의 피드백을 직접 받는 학습 기법, 인간 피드백 강화학습(RLHF, Reinforcement Learning from Human Feedback)이다.


인간 피드백 강화학습, RLHF는 인공지능이 사람의 피드백을 직접 받는다. 기존의 강화학습에 인간의 지식과 판단을 추가하므로, 인공지능이 보다 유연하게 대답하고 인간의 의도에 더 부합하는 결과를 만들게 된다. 사람은 피드백 과정에서 인공지능에게 보상을 주기 때문에 인공지능은 학습이 진행되면 될수록 인간과 유사한 행동을 하게 된다.


RLHF : LLM(거대 언어 인공지능)은 인간의 넛지가 필요하다


사람의 직접적인 개입을 통해 만들어진 대규모의 고품질 데이터셋을 기반으로 하였기에 챗GPT는 사람보다 더 사람같이 대답한다. 이는 사람이 직접 질문/대답 데이터셋을 다듬고, 사람이 답변의 평가순위를 정하는데 개입하기 때문이다. 챗GPT의 학습과정을 사람으로 비유를 하자면 과외 선생님이 문제도 만들어주고 과외 선생님이 정답까지 족집게로 알려주는 것과 유사하다고 할까?


우리가 사교육을 받게 되면 성적이 오른다. 챗GPT 역시 과외와 비슷한 학습을 통해 답변의 질이 급격히 상승하였다. 하지만 사교육을 받게 되면 자연스레 따라오는 문제점들이 있듯이, 챗GPT를 비롯한 지금의 거대 인공지능들 역시 문제점들을 안고 있다. 




사교육에서 자연스레 따라오는 문제 중 하나는 바로 비용이다. 일반적으로 사교육은 비싸다. 학원비는 기본이고 족집게 과외라도 받게 된다면 사교육비는 어마어마하게 상승하게 된다. 챗GPT를 비롯한 거대 인공지능 역시 운영비용이 어마어마하게 발생하고 있다. 초창기 출시된 챗GPT에서 활용한 GPT-3 모델을 학습하는데 든 비용만 최소 150억 이상으로 추산하고 있다. 현재의 챗GPT를 운영하는 데는 하루에 9억 원 이상의 비용이 지출된다는 분석 기사도 있다. 인공지능은 기본적으로 하드웨어가 뒷받침되어야 한다. 현재의 챗GPT가 활용하는 언어 모델인 GPT-4를 훈련하는 데에는 개당 4천만 원이 넘는 그래픽카드가 1만 장 넘게 쓰였다고 한다. 지금 이 시간에도 훈련을 하고 있을 챗GPT는 실시간으로 돈을 하마처럼 잡아먹고 있다. 


그래서일까. 챗GPT를 만든 회사인 오픈AI는 데이터를 평가하는 인력으로 케냐의 노동자를 아주 헐값에 고용해서 논란에 휩싸인바 있다. 인공지능 모델을 개발하는 것은 본사의 인력들이 진행을 하지만 온라인상의 혐오 및 잘못된 정보를 챗GPT가 학습하지 못하도록 하는 작업에 케냐의 데이터 노동자를 대거 고용한 것이다. 이들 케냐의 데이터 노동자들은 챗GPT의 유해성을 낮추는 과정에 투입돼 시간당 2달러 미만을 받고 폭력 및 성적 학대 콘텐츠를 걸러내는 작업을 수행했다. 이 과정에서 살인, 아동 성학대 등 폭력적인 콘텐츠를 접한 노동자들이 불면증, 우울증, 공황장애에 시달렸다고 현지 언론은 전하고 있다. 일론 머스크는 이를 두고 다음과 같은 말을 남긴 바 있다.


챗GPT를 위해 케냐인들이 'AI 기니피그(생체 실험 대상 동물)'이 되었다


오픈AI는 2021년 챗GPT 결함을 보완하기 위해 영어가 가능한 케냐 노동자들을 시간당 1.32~2달러로 외주 고용하여 논란이 된 바 있다. (출처 타임지)


인간의 개입을 통해 학습 모델을 만드는 것은 챗GPT 뿐만 아니라 대부분의 인공지능 모델이 활용하는 방법이다. 이 과정에서 비교적 단순 노동으로 할 수 있는 일들은 개발도상국의 노동자들이 수행하게 된다. 인도의 한 데이터 노동자는 탄산음료의 병 이미지들을 보고 닥터페퍼를 골라내야 했다. 태어나서 단 한 번도 보지 못한, 인도에서는 판매하지도 않는 닥터페퍼를 구분하는 책임이 인도 데이터 노동자들에게 주어진 것이다. 


우리는 과거 개발도상국의 노동자들이, 심지어 어린아이들까지도, 글로벌 대기업에 혹사당한 사례를 많이 보았다. 아직도 이러한 일들이 벌어지고 있겠지만 공정 무역(Free Trade) 등의 기조가 확산이 되며 표면적으로는 노동 환경이 개선된 바 있다. 하지만 인공지능 산업에서는 이제 노동력 착취가 시작되고 있다. 데이터를 정제하는 작업은 인공지능에서 가장 뼈대가 되는 작업이지만 가치를 인정받지 못하고 표면에 드러나지 않는다. 챗GPT가 화려한 주목을 받고 있는 동안, 케냐의 데이터 노동자는 불법적이고 폭력적인 콘텐츠에 노출된 채 낮은 급여를 받고 있다. 




이렇듯 사람이 직접 개입을 해서 학습을 돕는 것은 사람에게도 인공지능에게도 명확한 장점과 단점을 가지고 있다. 당연한 이야기이지만 장점은 취하면서 단점은 보완해야 할 방법을 찾아야 한다. 다시 우리 아들의 사교육 얘기로 돌아가보자. 이상적으로는 혼자서 스스로 공부를 하는 것이 제일 좋다. 하지만 옆에서 누군가 잡아주지 않는다면, 부모가 잘못된 방향으로 자습을 시키게 되면 오히려 역효과를 불러올 수 있다. 반대로 비용은 비싸지만 체계가 잘 갖춰져 있는 사교육에만 전적으로 의존하게 된다면 학업 성적은 잘 나올 수 있으나 지출이 커질 수도 있고 스스로의 힘으로 문제를 해결하는 능력이 떨어질 수 있다. 그리고 많은 아이들은 고액의 사교육을 받아도 원하는 만큼의 성취를 이루지 못하는 경우도 많다.


결국 언제나 답은 하나마나한 소리 같지만 또 중요한 중도의 길을 찾아가는 것이 아닐까? 적당한 사교육의 개입과 혼자서 공부하는 능력을 함께 키워주는 적정선을 찾아가는 과정. 그 과정의 시작에 접어든 만 2세, 31개월, 내년이면 옛날 한국나이로 5살이 되는 아들의 학습 과정을 잘 만들어갈 수 있도록 계속 고민하고 실행해 보고 또 실패도 하면서 개선 과정을 찾아봐야겠다.

이전 04화 로봇청소기와 강아지의 합작품: 개똥 마법진
brunch book
$magazine.title

현재 글은 이 브런치북에
소속되어 있습니다.

작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari