인공지능은 어떻게 동작하는 걸까?

인공지능과 빅데이터, 미묘한 차이

Aug 6. 2017

알파고 등장 이후 인공지능이 제대로 대세가 됐습니다. 구글과 아마존 같은 기존 IT 강호들은 무인자동차, 알렉사를 선보이며 자신들이 갖고 있는 인공지능 역량을 뽐내고 있고 삼성과 LG처럼 후발 기업들은 인공지능 전문가를 채용하고 뒤늦게라도 기술 역량을 축적하기 위해 아낌없이 투자하고 있습니다. 인공지능 스타트업도 우후죽순으로 생길 뿐만 아니라 전혀 별개인 영역인 정치인들도 4차 산업혁명 이야기를 꺼내고 있으니 머지 않아 우리 실생활에 빼놓을 수 없는 기술이 될 것 같습니다. 그런데 우리는 정확히 인공지능이 무엇인지, 그리고 어떻게 동작하는 것인지 모릅니다.

지금 우리에게 가장 익숙한 인공지능인 알파고로 설명을 해보겠습니다. 알파고를 만든 딥마인드(Deep mind)는 알파고가 학습하는 방법을 코드로 구현 한 후 그동안 모아 둔 엄청난 양의 바둑 기보 양의 기보를 학습시켰습니다. 그 결과 인공지능은 매번 바둑 수에 따라서 어디로 두는 것이 자신에게 가장 유리한지를 알게 됐습니다. 그렇다면 인공지능은 "대량의 데이터를 학습한 결과물" 이라고 손쉽게 정의해볼 수 있을 것 같습니다.

그런데 대량의 데이터라면 어떤 단어가 떠오르지 않으세요? 2-3년전만해도 이 단어가 뉴스를 휩쓸고 다녔습니다. 바로 "빅데이터"입니다. 대량의 데이터를 축적한 기업 또는 연구소가 이 데이터를 분석하고 사용자에게 유용한 정보를 제공하기 위해 여러가지 연구를 진행하곤 했었죠. 덕분에 쇼핑몰에서는 특정 나이대의 소비자들이 어떤 상품을 선호하는지 파악하고 이에 맞춰 마케팅 전략을 짤 수 있었고 병원에서는 전염병의 감염 경로 및 속도를 파악할 수 있게 됐습니다. 이것 역시 대량의 데이터 덕분입니다.

인공지능은 대량의 데이터를 학습했고 빅데이터는 분석했습니다. 학습과 분석. 사실 이렇게 개념으로 표현해서 달라 보이는 것이지 데이터를 이용했다는 사실 만큼은 둘다 동일합니다. 데이터를 사용한 사실 하나만 놓고 보면 둘 간의 경계가 매우 모호한것 같습니다

인공지능과 빅데이터 모두 대량의 데이터를 사용한다는 점은 다를 것이 없어 보입니다

하지만 둘 사이에 예측이란 단어를 놓으면 차이는 확연히 구분됩니다. 빅 데이터는 (물론 분야마다 다르긴 합니다만) 예측이 주 목적은 아닙니다. 로그와 사진, 텍스트 파일이 혼합된 데이터 집합을 Hadoop같은 분산처리 시스템과 NoSQL 같은 새로운 데이터베이스 형식을 이용해 잘 분류 한 후 전체적으로 어떤 경향을 띠고 있는지 파악하는 것이 빅데이터의 주 이용 용도입니다. 즉 어질러진(unstructured) 데이터들을 분석하기 좋게 정리정돈을 잘 한 후 여기서 유용한 정보(useful information)를 추출하는 것이 목표라고 할 수 있습니다.

각 부위를 조사하면서 코끼리임을 밝혀내는게 Bigdata의 목표입니다

이와 달리 인공지능은 잘 정돈된 데이터(structured)를 학습 알고리즘을 통해 학습 한 후 가장 그럴듯한 미래를 예측합니다. 알파고로 예를 들면 기보는 학습에 사용된 잘 정돈된 데이터 였고 알파고가 놓았던 수들은 학습의 결과 현 상태에서 알파고가 승리할 확률이 가장 높은 수들이였습니다.

자 그러면 이제 인공지능을 정의 해볼 수 있겠습니다. 인공지능은 "잘 정돈된 대량의 데이터를 학습해 가장 그럴듯한 미래를 예측한다". 엄청 거창한 것이 나올 줄 알았는데 의외로 간단하지요? 정의를 아래의 그림처럼 표현해 볼 수 있습니다

좋은 데이터를 학습한 모델은 가장 그럴듯한 미래를 예측 할 수 있습니다.

여기서 모델은 잘 정돈된 데이터를 학습한 결과물입니다. Test Data를 모델에 입력하면 가장 그럴 듯한 결과를 예측합니다. 머신러닝의 성능은 얼마나 예측을 잘하는 모델을 잘 만드느냐에 달려있습니다. 그리고 모델은 얼마나 풍부한 데이터를 갖고 있는지, 얼마나 우수한 학습 알고리즘을 사용하고 있는지로 결정되지요. 많은 인공지능 연구자들은 축적된 데이터를 이용해 좋은 학습 알고리즘을 만드는데 시간을 많이 투자했고 가장 간단한 선형 회귀(Linear Regression) 부터 인간의 뇌 뉴런 구조를 모방한 뉴럴 네트워크(Neural Network)까지 만들어둔 상태입니다.

그런데 반드시 위의 방식으로 작동하는 것은 아닙니다. 어떤 인공지능은 데이터 없이 스스로 학습을 하기도 합니다. 올해 커제와 붙은 알파고는 별다른 기보 학습 없이 자기와 동일한 컴퓨터를 복제해 이것과 수만 대국을 대결하면서 실력을 쌓았습니다. 전기 공급이 계속 될 때까지 자신과 맞붙으며 더 훌륭한 기보를 학습해가는 것이지요. 이것이야말로 자신의 한계를 실제로 극복한 사례가 아닐까 생각이 듭니다. 어찌 보면 꿈같은 생각이죠? 이런 학습법이 바둑뿐만 아니라 다른 분야에도 얼마나 임팩트를 줄지 기대됩니다.

keyword

생계형 개발자 직업 개발자

백엔드 개발자입니다. 글쓰기와 책읽기를 좋아합니다. 가치있는 소프트웨어를 만들고 싶습니다.

팔로워 201

작가의 이전글개발자는 이제 인공지능을 공부해야 합니다뛰어난 개발자가 되고 싶다면작가의 다음글