딥러닝 공부를 하다가 불현듯 인문학이 생각난 어느 날
요즘 최순실이라는 분 때문에 나라가 많이 시끄럽습니다. 평소에 웬만한 뉴스거리에는 눈길을 잘 주지 않는데 이 정도 규모의 사건은 상아탑에서 살아가는 사람도 무심코 지나칠 수 없네요. 일단 최순실이라는 분이 어떠한 잘못을 하고 이는 왜 비판받아야 하며 또 이를 어떻게 바로잡아야 하는가에 대해서는 이미 많은 언론과 오피니언 리더들이 이야기를 하고 계시니 저는 "대통령의 연설문과 딥러닝"이라는 거창한 낚시성 주제를 가지고 연구실에서 공부를 하다가 부득불 이 사건을 주목하게 된 대학원생의 생각을 써 내려가 보고자 합니다.
사실 대통령의 연설문과 딥러닝에는 직접적으로는 어떠한 관련도 없습니다. 앞서서 말했듯이 낚시성 제목입니다. 사실 굳이 딥러닝을 연관 지어 이번 사건을 이야기할 필요도 없겠지요, 오히려 이런 제목을 보신다면 어떤 분들은 대통령과 알파고의 이미지가 묘하게 오버랩되는 장면을 떠올리실 수도 있겠습니다.
제가 하고 싶은 이야기는 학습하는 딥러닝과 변해가는 우리 사회의 모습입니다. 나라가 너무 시끄러워 공부를 잠시 쉬며 멍을 때리던 중 딥러닝이라는 학습 알고리즘의 학습방식이 우리 사회가 변해가는 방식과 묘하게 비슷하다는 생각을 했습니다. 그래서 이 Nerd 스러운 글을 계속 읽으시도록 만들기 위해 우선 딥러닝에 대해서 짧게 설명을 시작하겠습니다.(설명은 아주 추상적이고 제 멋대로 이니 학술적으로 받아들이지는 마세요)
딥러닝은 아주 깊은 하나의 네트워크입니다. 중간에 노드(점)들이 있고 노드들이 엣지(선)로 연결되어 있는 구조입니다. 그리고 노드들은 서로 신호를 주고받습니다. 대략 아래 그림처럼 생긴 모습입니다.
혹자는 이러한 구조가 인간의 뉴런을 모방하였다고 해서 이를 인공신경망이라고 부르기도 한답니다. 뉴런이 작용하는 방식과 정확하게 일치하는 것은 아니지만 말이죠. 비슷하다고 생각되시나요?
딥러닝 알고리즘은 이러한 구조를 이용해 학습을 합니다. 어떻게 학습을 하느냐 하면, 컴퓨터에 데이터를 입력해주고 이를 네트워크를 통해 흘려보냅니다. 이런 의미에서 데이터는 네트워크에 들어가는 순간 노드들 사이를 타고 흐르는 신호에 가깝다고 볼 수 있을 것 같습니다. 신호는 네트워크를 타고 흐르면서 증폭되기도 하고 사라지기도 합니다. 그리고 신호가 최종 노드에 도착했을 때 그 마지막 신호가 딥러닝이 내린 결론이 됩니다. 그리고 사람은 딥러닝이 내린 결론과 실제의 답(진리)을 비교해서 점수를 주게 됩니다. 만약 안 좋은 점수를 받게 되면 컴퓨터는 네트워크에서 신호가 흐르는 방식을 조금씩 바꿔가며 정답에 가까운 결론을 내리도록 노력을 합니다. 이를 우리는 기계가 학습한다고 말하고 조금 더 세련된 단어로 머신러닝이라고 부릅니다. 그리고 특히 사람이 실제 답을 알려주는 이러한 방식을 지도 학습 방식이라고 합니다. 제가 오늘 하고 싶은 말의 요지는 붉게 칠한 단어들에 모두 담겨있습니다. 다음 그림은 위 내용을 그림으로 간단하게 표현해 본 것입니다.
고양이 사진을 입력받았는데 컴퓨터는 털 뭉치라고 대답했습니다. 올바른 답이 이미 정해져 있기 때문에 컴퓨터는 자신의 잘못을 깨닫고 신호를 전달하는 방식을 아주 조금씩 수정합니다. 그리고 이러한 훈련이 수십만 번 반복해서 진행되면서 컴퓨터가 올바른 결론을 내릴 확률이 증가합니다.
그런데 딥러닝은 말 그대로 아주 깊은 네트워크를 가지고 있습니다. 노드 사이가 멀면 서로 간의 피드백을 주고받는 과정이 굉장히 더딥니다. 하지만 학습이 계속 반복될수록 네트워크는 아주 멀리 떨어진 노드들끼리도 조금씩 조금씩 서로 영향을 주고받습니다.
마지막으로, 노드들은 각자 하는 일이 조금씩 다릅니다. 데이터 입력과 가까운 곳에 있는 노드들은 데이터의 아주 지엽적인 특징들을 포착해서 신호로 전달하고 결론에 가까운 노드일수록 전체를 아우르는 추상적인 특징을 전달하는 역할을 합니다. 아래 그림처럼 얼굴 사진이 네트워크를 타고 흐르다 보면 매우 추상적인 몇 개의 색들과 모양으로 표현이 되고 컴퓨터는 지엽적인 특징이 아닌 추상적 신호를 근거로 최종적 결론을 내리게 됩니다.
딥러닝의 구조를 들여다보고 있으면 우리가 살아가는 사회와 참 많이 닮았다는 생각을 합니다. 수많은 유기체들이 모여서 또 다른 하나의 유기체처럼 보이게 됩니다. 우리 사회의 구성원들이 하는 일은 조직과 사회적 위치에 따라서 구조화되어있지요. 그리고 우리들 한 사람 한 사람은 각자의 위치에서 다른 노드들에 신호를 전달하고 있습니다.
우리들의 행복은 가정이라는 노드의 신호를 통해 사회에 전달되고 있고, 아이들이 건강하게 자라고 있는지는 학교라는 노드의 신호를 통해서 전달됩니다. 우리가 물질적으로 부유해지고 있는지는 아마도 기업이라는 노드의 신호를 확인해 보면 될 것입니다. 이 외에도 우리가 상상할 수 있는 노드들은 엄청나게 많을 것입니다. 우리들이 일하는 곳, 생활하는 곳, 봉사하는 곳 등등...... 이렇게 사회의 각 단계마다 자리 잡고 있는 노드들에서 받아들이는 일상에 근거해서 신호를 보내고 있습니다. 이 신호들은 사회라는 거대한 네트워크를 흘러 마지막 노드까지 흘러가게 됩니다.
위에서도 언급했듯 일상에 가까울수록 신호는 지엽적인 특징을 잘 포착하고 최종 노드에 가까울수록 신호는 추상적입니다. 예를 들어 저는 몇 개월간 연구에 매진한 결과 앞으로도 돈 걱정 없이 연구할 수 있도록 장학금을 받게 되었습니다. 저의 가족은 기뻐할 것이고, 저의 학교는 학생의 연구 성과에 고무될 것입니다. 이러한 신호들은 매우 일상적이고 이해하기 쉬운 것들이죠.
이러한 신호들이 여러 노드들을 거쳐 멀리 떨어진 국회 노드 또는 정부기관 노드까지 흘러들어갔다고 해보겠습니다. 이 노드들에 전달된 신호는 저의 개인사에 대한 내용이 아닐 것입니다. 그곳에서는 아마도 이 사회가 정의로운지, 공평한지, 창의적인지, 폐쇄적인지, 부패한 지 등에 대한 추상적인 신호들을 받아들이고 전달할 것입니다. 제가 장학금을 받게 되면서 만들어진 신호는 아마도 우리 사회가 창의적이고 공평하다고 국회 노드와 정부기관 노드가 받아들이는데 영향을 줄 것입니다. 물론 제가 속한 노드와 멀리 떨어진 두 노드 간의 피드백은 매우 간접적이고 느립니다.
최종 노드에 전달되어 결론을 내리는 데 사용될 신호가 2가지라고 해보겠습니다 : 첫 번째, 이 나라는 살기 좋다. 두 번째, 이 나라는 살기 좋지 않다. 판단자는 실제의 답(진리)과 전달된 신호를 비교합니다. 그리고 신호가 잘못 전달되었을 경우에는 신호가 잘못 흘러오고 있다고 지적을 하고 신호가 정확하다면 잘 하고 있다고 칭찬을 하겠죠. 그런데 안타깝게도 우리 사회에서는 실제의 답을 알 수 있는 방법이 없습니다. 실제 사회에서의 정답은 정해진 레이블이 아닌 가치 판단의 문제이기 때문이죠. 이렇게 판단자, 즉 리더의 최종적 판단은 사회를 변화시키게 됩니다. 그리고 리더들이 가진 가치에 따라서 사회는 일관된 방향으로 신호를 보내도록 학습하게 됩니다. 실제의 정답은 가치판단의 문제라는 점을 다시 한번 강조하고 싶습니다. 그렇기 때문에 궁극적으로 보수이냐 진 보이냐를 두고 리더의 업적과 자질을 평가할 수는 없는 것이라고 생각합니다. 하지만 2016년 우리 사회는 지금 뭔가가 잘못되어있습니다. 왜일까요?
네트워크가 내린 결론과 실제 정답에 따라서 신호를 보내는 방식을 조금씩 수정해 나가는 과정을 역전파라고 합니다. 이 과정을 통해 네트워크는 정답에 가까운 답을 찾아가는 방식을 배웁니다. 역전파가 잘 되려면 일관된 가치를 갖고 정답을 제시할 수 있어야 합니다. 하지만 지금 우리 사회는 일관성 없는 정답에 혼란스러운 역전파 과정을 거치고 있는 것 같습니다. 지록위마라는 작년쯤 유행했던 사자성어의 말처럼 우리의 리더는 지금 사슴 사진을 보고 말이라는 정답을 제시하고 있습니다. 이는 가치 판단의 문제가 아닌 명백한 오류로 보이는 정답입니다. 한두 번쯤은 이렇게 오류가 있는 답을 사용하더라도 사회가 갑자기 확 뒤집어지는 것은 아닙니다. 4대 강 사업을 벌이고, 세월호 사건을 방치한 것에 대해 Wrong이라는 정답을 제시하지 않았어도 우리 사회의 신호체계가 완전히 망가져버리는 것은 아닙니다. 멀리 떨어진 두 노드 간의 피드백은 매우 간접적이고 느리고, 현실과 정치의 괴리가 아주 크기 때문이죠. 그런데 지난 수년간 우리 사회는 잘못된 정답을 너무 많이 받아들였나 봅니다. 이제는 사회 곳곳이 자꾸 이상한 신호들을 보내는 것 같습니다. 학교가 학문을 가르치는 곳이 아닌 부폐와 손잡는 법을 가르치는 곳이라는 잘못된 신호를 우리는 목격했습니다. 검찰은 범법자의 재력에 따라 처벌을 차등 적용한다는 이상한 신호도 우리는 보았습니다. 잘못된 정답을 받아들일수록 우리 사회의 신호들은 방향을 잃어갑니다. 어떠한 일관된 결론도 내릴 수 없는 망가진 네트워크가 되는 것이죠.
컴퓨터는 스스로를 고칠 수 없습니다. MS에서 얼마 전 챗봇 "테이"를 출시했습니다. 유저들에게 막말을 쏟아내서 얼마 안 되어 서비스가 중단되었죠. 잘못된 단어들을 계속해서 학습했기 때문입니다. 기계는 가치판단을 할 수 없기 때문입니다. 하지만 사람은 다릅니다. 잘못된 답을 학습하는 것을 그만하고 이제 스스로를 자정해야 할 때입니다.
인문학이라는 말을 저는 우리가 사는 세상의 가치에 대한 공부라고 알고 있습니다. 우리 사회는 지금까지 이런 공부를 너무 소홀히 한 것은 아닐까 생각해봅니다. 아니면 너무 책으로만 배워서 잘 사용하지 못하고 있는 것 일수도 있겠습니다. 지금은 노벨 물리학상, 수학상, 화학상 이런 것을 받는 것을 걱정할 것이 아니라 맨 부커상을 받았다는 우리나라 작가의 작품을 한 번이라도 읽어봐야 할 때가 아닐까요?
평등하고, 공정하고, 정의롭고, 창의적인 것들이 좋은 나라를 만든다는 것은 정답입니다.