brunch

이미지 인식을 위한 인공지능

피카소가 4차 산업혁명을 이끌었다.

by 정연섭

소위 4차 산업혁명기술의 핵심기술로 인공지능이 포진하고 있다. 사물 인터넷과 가상현실 기술도 후보에 포함되지만 인공지능과 차원이 다르다. 사물 인터넷과 가상현실은 양적 성장이고, 인공지능기술은 질적 도약인 탓이다. 바둑을 평정한 알파고를 상기하면 인공지능의 능력은 이미 입증되었다. 앞으로도 인간보다 탁월한 자율 자동차, 번역시스템이 나올 것이다.


만일 알파고가 구글을 등에 업지 않고 시골 기원에 나타났다면 사람들은 바둑만 잘 두는 자폐아 정도로 여겼을 거다. 바둑 외에는 멍청하기 때문이다. 뿐만 아니라 오랫동안 개발한 자율 자동차는 초보운전자보다 못하고, 번역 시스템의 문장은 아직은 어색하다. 따라서 인공지능시스템을 경시하기 쉽지만 이는 큰 오산이다.


더 이상 알파고를 개량하지 않겠다는 선언은 이세돌, 커제보다 뛰어난 인간이 나와도 알파고를 이기지 못한다는 완곡한 표현이다. 알파고가 기존 기보로만 다음 수를 찾아낸다면 이런 선언을 하기 어렵다. 이 선언의 배경에는 알파고가 최선의 수를 찾는 알고리듬으로 무장되어 있다는 의미이다. 인간이 아무리 사칙연산을 잘해도 컴퓨터를 따라가지 못하듯이 이제부터 바둑에서는 인간이 알파고를 영원히 이길 수 없다. 지금은 설익은 자율주행 시스템, 번역시스템이지만 수학적 알고리듬으로 무장되면 이들도 인간을 뛰어넘고, 더 이상 자율주행차와 번역시스템을 개선하지 않는다는 선언이 나올 것이다. 결국은 인공지능을 이야기하지만 더 중요한 기술은 수학적 알고리듬이다.


사람은 사람의 힘이나 기기의 힘을 빌려 업무를 수행한다. 자동차는 빨리 달리지만, 사람은 물체 구분을 잘하고, 컴퓨터는 사칙연산을 잘하지만 사람은 전략을 잘 세운다. 4차 산업혁명 이전에는 기기가 잘하는 분야와 사람이 잘하는 분야가 확실히 구분되어 있었다. 일반적으로 사람이 잘하는 분야는 패턴을 인식하고 추상적인 사고가 필요한 분야였고, 기기가 잘하는 분야는 계산이나 운동 방정식으로 표현되어 알고리듬이 명확한 분야였다.


오랫동안 과학기술자들은 바둑의 다음 수나 이미지의 패턴 인식의 기계적 알고리듬을 찾으려고 노력하였으나 성공하지 못하였다. 이 와중에 일련의 사람들은 동물은 가르치지 않아도 패턴을 잘 찾으므로 생물의 뇌에서 방법을 배우고자 하였다. 놀랍게도 이 방식은 성공을 거두었고 뇌가 작동하는 수학적 알고리듬을 찾아내는 쾌거를 이루었다. 따라서 인공지능을 이해하기 위해서는 인공지능에 적용되는 뇌의 작동방식을 이해하여야 한다. 이 글이 이미지 인식에 대한 뇌의 알고리듬을 설명하고자 하는 이유이다.


우리는 발전소에 가 보지 않아도 발전소를 이해하는 이유는 설계 도면이 있기 때문이다. 아래 그림은 3차원 물체의 형태를 표시하기 위한 X, Y, Z 축으로 평면도를 보여주고 있다. 만일 3차원 물체의 형태가 복잡하다면 3개의 평면도로는 부족할 것이다. 그 경우에는 3개의 축이 아니라 빙돌아가면서 평면도를 얻어야 한다. 차를 렌트한 분들은 차체에 흠집이 있는지 이런 사진을 찍어 본 경험이 있으리라.



평면도의 가치는 3차원 구조를 몰라도 2차원 평면도가 많으면 3차원 물체를 복원할 수 있다는 점이다. 또한 2차원 구조를 몰라도 1차의 정보가 충분하면 2차원 도형을 알 수 있다. 동일한 원리가 이미지 인식에도 적용된다. 3차원 얼굴 모습이 없어도 2차원 평면도로 얼굴을 인지해 낼 수가 있다.


뇌의 인지는 평면도와 조금 다른 방식을 취한다. 아래 그래프는 합성곱(CNN: Convolution Neural Network)이라는 이미지 처리방식이다. 이미지 원본 사진에 이동하는 노란 창을 곱하고, 각 칸을 더하면 합성곱 이미지가 얻어진다. 이렇게 얻어진 특징 이미지를 통해 역으로 원래 이미지를 알아낼 수 있다. 사람의 얼굴을 잘 기억하는 사람들은 안경을 끼었는지, 코 모양 등을 기억한다고 하는데, 안경이나 코 등이 얼굴의 특징 인자이다.


CNN에서는 왜 인접한 칸끼리만 합성곱을 할까요? 답은 이미지 인식 성능이 좋기 때문이고 더 근본적 이유는 이웃끼리 연결된 선이 중요하기 때문입니다. 우리가 사물을 인식할 때 사물의 윤곽선을 따라가지 않습니까? 윤곽선은 인접한 칸사이의 연결이거든요.

Convolution_schematic.gif


아래 그림은 원본 얼굴을 합성곱 처리를 했을 때 나타나는 특징 이미지이다. 더 인식하기 어렵게 되어 있다고요? 맞습니다. 사람은 중간과정을 인식하지 못하고 결과만 인식하기 때문에 뇌 속에 합성곱 특징 이미지가 있는지 알지 못합니다. 그래서 특징 사진은 생소하게 느껴집니다. 그렇지만 눈이 먼 사람에게 특징 이미지를 뇌 속에 직접 입력하면 뇌는 얼굴을 유추하여 냅니다. 저는 이 특징 이미지를 보면서 피카소를 생각했습니다. 피카소는 입체파 화풍을 창조했는데 사물에서 선과 기하학적 특징을 추출하였죠? 저가 생각하기에는 피카소는 일반 사람들이 못 보았던 뇌 속의 특징 이미지를 보았던 것이 아닐까?


cnn_convolution.png


이미지 인식에 사용되는 CNN의 수학적 알고리듬은 바둑의 인공지능 알고리듬과 다릅니다. 또한 자율운행이나 번역시스템의 수학적 알고리듬과도 다르지요. 그렇지만 모든 인공지능에는 인간의 뇌가 사용하는 수학적 알고리듬이 들어 있습니다. 이 알고리듬이 밝혀지는 날 인간은 적어도 특정 분야에서는 인공지능의 적수가 될 수가 없습니다.


너무 슬프다고요? 저는 그렇게 비관적이지는 않습니다. 아직 인공 지능이 따라오지 못할 분야들이 많이 있습니다. 이런 분야를 제시하라면 좀 생각을 해야 하지만 쉬운 방법 하나만 알려드리겠습니다. 바둑에서 상대방을 교란시키기 위해 흔들기를 시도한다고 하는데 사실 이는 반칙은 아니죠. 그런데 정말 정치가처럼 일관성이 없거나 반칙을 하면 인공지능이 인간을 절대 이길 수가 없습니다.

keyword
작가의 이전글과학과 소설의 경계