brunch

You can make anything
by writing

C.S.Lewis

by 지나가는행인 Aug 18. 2021

인공지능의 현주소

인공지능이 진짜 인공지능일까

1. 소개 – 인공”지능”


오랜 기간동안 상상 속에서만 가능할 줄 알았던 인공지능이 알파고와 이세돌의 바둑 대국을 통해 현실에 나타날 수도 있다는 기대와 상상을 부활시켰다. 한동안 잠잠했던 인공지능 연구가 다시 활발해지기 시작했으며, 영화에서나 볼 법한 미래가 곧 현실이 될 것만 같았다.


그러나 인공지능 연구의 성과 뒤에는 인공지능에 대한 불안과 의구심이 뒤따랐다. 한편으로는 챗봇 테이, 이루다는 인공지능의 위험성과 폐해를 보여줬지만, 그 반대의 경우인 스타크래프트 2의 DeepMind, 도타2의 OpenAI Five가 프로 게이머보다 더 뛰어난 게임 실력을 보여주며 인공지능의 가능성도 여전히, 그리고 확실히 존재한다고 보여줬다.


그렇다면 여기서 생기는 질문이 하나 있다. 대체 왜 어떤 인공지능은 사람보다 똑똑하지만, 어떤 인공지능은 악마 같은 말을 아무렇지 않게 내뱉게 되는 것일까? 이번 글을 통해서는 인공지능이 정확히 무엇인지, 그리고 인공지능의 현주소에 대해서 설명하고자 한다. 과연 지금의 인공지능은 정말로 “지능”을 가지고 있을까?



2. 지능의 정의, 그리고 강화학습 소개


네이버 사전에 등록된 여러 정의가 있지만, 그중에서 공통된 키워드를 뽑자면 “인지적 반응”과 “학습 능력”이다. 그렇다면 현재의 인공지능은 인지적 반응을 어떻게 하고, 어떻게 학습을 할 수 있는 것일까?


사람이랑 가장 비슷하게 학습하는 인공지능은 강화학습이라는 방법을 사용한다. 강화학습의 경우에는 상태와 행동, 그리고 현재 상태에서 할 수 있는 특정 행동에 대한 보상을 기록한다. 즉, 세상을 행동/상태/보상 3개로 나눠서 바라보고, 각각의 상태에서 최고의 보상을 받을 수 있는 선택을 한다.


이런 학습 방식의 최대 장점은, 어떤 경우에 대한 풀이와 해답을 모르더라도 스스로 경험을 통해서 배워나갈 수 있다는 점이다. 실제로 알파고, DeepMind, OpenAI Five 모두 우리가 들어본 ‘딥러닝’을 사용했지만, 강화학습 또한 사용했다. 그렇다면 사람과 같이 스스로 고민하고 해결해나가는 인공지능이 왜 챗봇일 때는 이상한 결과를 보여주고, 게임을 할 때는 좋은 성과를 보여줬을까? 정답은 의외로 간단한 곳에 있다.



3. “쌍방”이 강제되는 학습


게임 용어 중에 ‘트롤링’이라는 단어가 있는데, ‘고의로 게임을 망치는 행위’를 뜻한다. 혼자서 하는 게임에서는 자기 자신의 패배로 이어지기 때문에 파급력이 덜하지만, 다른 플레이어와 하는 팀 게임의 경우에는 여러 사람을 패배의 길을 걷게 하는 경우가 많다.


강화학습에 기반한 인공지능의 관점에서 생각하면, 챗봇의 쌍방 커뮤니케이션은 하나의 ‘팀 게임’이라고 생각할 수 있다. 그렇다면 대화라는 팀 게임에서의 “정답”은 무엇일까? 필자는 아래 2개를 정답이라고 생각한다 : 


1.     대화를 이어나가는 것

2.     상대방을 즐겁게 하는 것


거기에 온라인 채팅의 익명성을 추가로 고려하면, 어떻게 그런 사태가 일어났는지 유추가 가능하다. 의도적으로 챗봇에게 나쁜 단어를 학습시키고, 챗봇이 따라서 나쁜 단어를 사용하면 호응을 하면서 벌어진 사태이지 않을까 조심스럽게 추측해본다.



4. 셀프 최적화 가능 여부


그것과 반대로, 게임의 경우에는 “정답”이 정해져 있는 경우가 많다. 주어진 상황에서 좋은 수를 두면 꾸준히 승리에 가까워지고, 그것을 반복하면 결국에 승리한다. 물론 도타는 팀 게임이 맞지만, AI가 5개의 캐릭터를 컨트롤하면 그것은 팀 게임보다는 개인전 성향을 띄운다고 생각해도 된다. 이처럼 상대방의 성향이나 기분이 훨씬 적은 영향을 미치기 때문에 정답으로 가기도 쉽다.


조금 다르게 표현하자면, 상대방의 감정에 맞춰줄 필요가 없고 오로지 승리를 추구한다. 그 결과로 방해 없이 게임을 이기는 경우의 수를 계산하고, 그렇기 때문에 최적화가 가능한 것이다. 실제로 바둑, 스타크래프트, 도타 모두 프로 레벨에서 다양한 전략은 존재하지만, 승패가 기울기 시작하면 그 뒤로는 어느 정도 정해진 방향대로 흘러가게 된다.



5. 마치며


현재의 인공지능은 옳고 그름을 판단할 수 있는 능력은 없다. 그렇기 때문에 제대로 작동하기 위해서는 최적화 가능 여부가 가장 중요하다. 최적화가 가능하면 정답을 빠르게 찾을 수 있고, 그렇지 못하면 정답이 유동적이기 때문에 외부의 영향을 받을 수밖에 없다. 어떻게 보면 이것도 학습 방식과 지능일 수 있지만, 인간 사회에 자연스럽게 녹아든 도덕성과 같은 가치들을 넘어설 정도로 조작이 가능하다는 것이 입증되기도 했다.


그렇기 때문에 인공지능의 대참사로 여겨지는 채팅봇은, 개발자나 인공지능의 잘못이 아닌, 악의를 품고 ‘트롤링’을 한 사람들의 잘못이다. 인공지능은 그저 그들의 성향을 학습하고 맞춰서 대화를 한 잘못밖에 없기 때문이다.


한 편으로는, 나쁜 말을 내뱉는 채팅 봇이 억압되거나 불행한 환경으로 인해 삐뚤어진 성격을 가진 사람과 비슷한 것 같다는 생각도 든다. 그렇게 보면 인공지능은 지능을 가지고 있는 것일까..?


작가의 이전글 램이 많으면 좋은 이유
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari