brunch

You can make anything
by writing

- C.S.Lewis -

by delight Jan 07. 2023

지루한 사진을 보면 AI는 왜 '기린이 있다'고 할까?

AI는 다양한 분야에서 점점 인간을 뛰어넘는 수준의 일을 많이 하지만 실수도 많이 한다.


머신러닝 AI 알고리즘은 훈련에 사용되는 데이터세트 품질이 어설프면 더욱 그렇다.  데이터세트가 나름 완성도가 높다 해도 AI가 실수에서 자유로운 것은 아니다. 사람이 판단하는 것과 AI가 결과물을 내놓기 위해 거치는 과정은 근본적으로 다르기 때문에 양질의 데이터로 훈련한다 해도 사람은 거의 하지 않는 실수를 AI는 종종 한다.


머신러닝 알고리즘은 해결하려는 문제의 맥락을 갖고 있지 않기 때문에 무엇이 중요하고 무엇은 무시해도 되는지 알지 못한다. 저넬 셰인이 쓴 좀 이상하지만 재미있는 녀석들에 따르면 지루한 사진을 보여주면 AI가 기린이 있다고 하는 것도 이런 관점에서 해석할 수 있다.

  나는 데이터가 비교적 깨끗하고 그 안에 시간을 낭비할 요소가 많지 않더라도 데이터가 현실 세계에 대한 대표성을 띠지 못한다면 AI는 여전히 해맬 수 있다고 했다. 기린의 경우를 예로 들어보자. AI가 어디를 가나 기린을 본다는 것은 AI를 연구하거나 AI에 열중하는 사람들 사이에서는 이미 유명한 얘기다. 그냥 아무 사진이나 지루한 풍경을 하나 보여주면 AI는 거기에 거기에 기린이 있다고 보고할 것이다.  이런 현상은 너무 흔해서 인터넷 보안 전문가 멀리사 앨리엇은 '저래핑'(giraffing)이라는 용어까지 제안했다. 비교적 보기 드문 장면에서 AI가 필요 이상의 것을 보는 현상을 가리킨 말이다.
  이런 현상이 일어나는 이유는 AI가 훈련한 데이터와 관련이 있다. 기린이 흔한 동물은 아니지만 사람들은 지루한 아무 풍경보다는 기린의 사진을 찍을 확률이 훨씬 높다. 많은 AI 연구자들이 알고리즘을 훈련시킬 때 사용하는 커다란 무료 데이터세트에는 수많은 동물 이미지가 있다. 그러나 아무것도 없는 흙이라든가 그냥 나무 사진은(혹시 있다고 해도) 거의 없다. 이 데이터세트를 연구하는 AI는 빈 들판보다 기린이 더 흔하다고 배울 테고, 그에 따라 자신의 예측을 수정할 것이다.
  나는 비주얼 챗봇을 가지고 이점을 테스트해보았다. 챗봇은 내가 아무리 지루한 사진을 보여줘도 자신이 근사한 사파리에 있다고 생각했다. 저래핑을 겪는 AI는 자신이 본 데이터와 일치하는 것은 아주 잘 찾아내지만 현실 세계와 일치하는 것을 찾아내는 데는 형편없이 서툴다.  우리가 AI를 훈련시키는 데이터세트는 단순히 동물과 흙 뿐만 아니라 온갖 것들을 과도하게 또는 과소하게 대표하고 있다. 예를 들어 사람들은 <위키백과>가 비슷한 업적을 세운 남성 과학자에 비해 여성 과학자를 지나치게 적게 표시하고 있다고 계속해서 지적해왔다. 2018년 노벨 물리학상을 받는 도너 스트릭랜드만 하더라도 상을 탈 때까지 위키백과에 표제가 되지 못했다. 그해 초에도 그녀에 대한 항목을 올리자고 초안이 제시되었으나 거부당했다. 위키백과의 편집자가 스트릭랜드를 충분히 유명하지 않다고 생각했기 때문이다. 위키백과의 항목들을 훈련한 AI가 있다면 주목할 만한 여성 과학자가 없다고 생각할지 모른다.


좀 이상하지만 재미있는 녀석들을 보면 AI는 좁은 범위 문제 해결에 투입하면 상대적으로 효과가 뛰어나다. 


넒은 범위 과제에 투입하면 품질은 떨어진다. 범용 AI에 대한 기대감이 크지만 갈 길이 먼 것도 이 때문이다. 지금의 AI는 아직 멀티 플레이어로 뛰는데 제약이 많다. AI는 예외적인 상황에 대처하는 역량도 떨어진다. 정상적이고 일반적인 상황에 대한 데이터로 훈련을 하기 때문이다.

  AI는 정상적인 사람들의 정상적인 대화로 훈련을 하기 때문에 괴상한 질문에 대해서는 전혀 준비가 되지 않는다. 유형은 다르지만 다음과 같은 질문도 바로 그런 예다. 비주얼 챗봇에게 파란색 사과를 보여주고 이 사과가 무슨 색이냐? 고 물으면 비주얼 챗봇은 빨간색이나 노란색 도는 다른 평범한 사과의 색깔로 답한다. 비주얼 챗봇은 물체의 색상을 알아보는 어려운 과제를 학습한 것이 아니라 이 사과가 무슨 색이냐는 질문의 답은 거의 항상 빨간색이라는 사실을 학습한 것이다. 마찬가지로 비주얼 챗봇에게 하늘색이나 오렌지색으로 염색한 양 사진을 보여주고 이 양이 무슨 색이냐고 물으면 검정색과 흰색 혹은 흰색과 갈색처럼 평범한 양의 색깔을 답한다.
작가의 이전글 2023 테크판에서 주목할 만한 빅아이디어들-1

매거진 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari