기술과 현실 사이..

인식 기술을 비즈니스 모델로 가져가면서 느낀 점들..

May 3. 2016

최근 몇달동안 파견되어 인식 기술이 실제 상품에 적용되게 하기 위해 이런 저런 일을 하면서 느낀 4가지...

인공지능 기술과 현실 사이에서 건너야 하는 4가지..

1. 기술과 비즈니스 모델 사이: 기술이 돈버는 문제로 가기까지...

알파고가 한국을 휩쓸고 나서 많은 스타트업, 사업계획서, 제안서에서 인공지능, 딥러닝, 강화학습이란 단어를 쉽게 볼 수 있다. 이 단어 옆에 의료, 핀테크, 스마트카, 개인화 서비스란 단어를 붙이고, 이들은 이 것이 새로운 시대를 열 비즈니스 모델이라고 말한다. 학계를 뒤집은 기술과 풀지 못 한 문제... 이 두개를 놓고 비즈니스 모델이라고 말하기엔 이 둘의 사이엔 엄청난 거리가 있음을 직시해야 한다.

많은 회사에서 "딥러닝 기술 혹은 인공지능 기술이 당사의 제품을/제품의 판매를 혁신할 수 있는 방안은 무엇인가?"란 질문들을 연구원들에게 던지고 있다. 또한 많은 스타트업 소개 자료에서 "딥러닝 기반으로 해결한..." 이란 소개 자료를 많이 접한다. 일단 이들에게 질문하고 싶은 질문은 지금 개발된 인공지능이.. 알파고에 쓰였다는 딥러닝, 강화학습, 검색 기술이 문제를 해결하고도 남을만한 성능을 보여주고 있는가? 이다. 기술의 성능은 강의 수심과 같다. 수영을 하지 못 하는 사람이 강에 건널 때, 그 수심이 100m이건 2m이건 건너기 힘든 수심이다. 최근 엄청난 발전이 강의 수심을 100m에서 2m로 줄였다고 해서 이것이 수영을 할 수 없는 사람이 건널 수 있는 강으로 바뀌었다고 할 수 없다. 마지막 몇십센티를 줄이느냐 못 줄이느냐가 핵심이다. 그리고 줄이는 방법을 마련하는 동안 안정적으로 연구하고 돈을 벌수 있냐는 또다른 과제이다. 이전 기술의 성능을 혁신적으로 높인 기술이 꼭 상품화가 될 수 있는 기술이 된 것은 아니다. 혁신이 되었더라 하더라도 사람들이 돈을 내고 사지 못할 정도의 성능이라면 상품화가 될 수 없다. 그렇기에 혁신적 기술의 이름과 문제만으로는 비즈니스 모델을 논할 수 없다. 그 강을 건너기 위해 놓아야 할 징검다리와 어떻게 놓을건지 그리고 그 비용을 충분히 고려해야 한다.

물론 딥러닝 기술이 엄청난 성공을 거두고 있고, 많은 문제를 해결할 것이다. 또한 지금까지 보지 못한 속도로 발전할 것이다. 그러나.. 그 엄청난 이름에 취해 건널 수 없는 강같은 제안서와 계획서를 쓰면 안 된다. 결국 우리는 제한된 자원과 시간안에 그 강을 건너야 하기 때문이다.

2. 학습데이터와 현실 사이: End-to-End 환상 밖으로...

이 분야에 대해서 조금이라도 아는 사람이라면 아는 대회가 있다. ILSVRC (Imagenet Large Scale Visual Recognition Challenge 맞나?)... 딥러닝을 유명하게 한 바로 그 대회. 매년 테스크가 바뀌지만 기본적으론 사진이 주어지면 1000개의 객체 중 어느 객체가 존재하는지 판단하는 것을 수행하는 대회이다. 강아지 사진을 주면 어떤 강아지가 있는지 기계가 맞추는 그런 대회이다. 최근 딥러닝 기술을 기반으로 한 몇 기술들이 인간의 정확도 (에러율 5.1%@top5) 를 뛰어 넘었다는 기사가 나왔고, 심지어 한국은 2019년 그 대회의 우승을 정부의 인공지능 개발 계획 목표로 삼고 있다 (훗... 비웃음 맞다).

그러나 이 성능이 top5 성능이라는 것을 인지하고 있는 사람은 많지 않다. 한마디로 답을 5개 내면 그 5개 모두 틀리지 않을 확률이 95%라는 것이다. 물론 이럴 수 밖에 없는 이유가 있다. 제공된 학습데이터와 정답셋이 모호하다. 예를 들어 정원에 강아지가 있는 사진이 있다고 치자. 강아지 옆에는 잔디가 있고, 강아지가 가지고 놀던 공이 있고, 또한 배경에 구름이 떠 있는 하늘이 보인다. 이 사진의 정답은 강아지라고 주어진다. 하나하나 구름, 잔디, 공 등을 정확히 알려주는 데이터는 전체 데이터에서 극히 일부분이다. 그렇기에 강아지와 공이 있는 사진에서 기계가 공이 있어요!! 라고 해도 정답으로 받아들여지지 않을 수 있다. 이렇듯 기계에게 자세한 모든 정보를 알려주고 가르쳐 주기란 쉽지 않다. 그 것도 수백만장을... 수천만장의 이미지에 그런 정보를 담기란 쉽지 않고, 이런 작업 조차도 인간이 하는 작업이기에 주관이 담겨지기 마련이란 이것 또한 100% 정확하다고 할 수 없다.

이런 이유로 Supervised learning에서 weakly supervised learning으로 또 언젠가는 unsupervised learning으로 가고 있다. 이런 연구는 데이터가 완벽하게 제공되지 않는 경우가 훨씬 많고 그럴 수 밖에 없음을 알고 있기에 그렇게 가고 있는 것이다.

그런데 만약 그런 데이터가 있다면 어떨까? 한땀한땀 손수 데이터에 무엇이 어디 있는지 정말 전문가들이 만든 데이터가 있다면?... 그래서 그 데이터를 기반으로 End-to-End 학습을 통해 엄청난 성능을 내는 기술을 만들어 낸다면? ... 과연 바로 가지고 나가 쓸 수 있을까?

물론 상황이 엄청나게 나아진건 인정할 수 밖에 없으나, 또하나의 난관이 있다. 이 데이터가 현실 세계의 모든 상황을 다 커버하고 있는가?란 질문에 대답을 해야 한다. 자율주행 자동차에서 End-to-End 학습을 통해 차량 및 도로를 인식하는 기계를 개발했다고 치자. 전문가가 손수 만든 잘 만들어진 데이터를 사용했다고 치자. 눈이 와도 되는가? 차량이 바뀌면? 도로에 싱크홀이 생겼다면? 몇년전 강남에서처럼 홍수로 도로가 잠겼다면? 역주행을 하는 차량이 발견되었다면? 우리나라가 아닌 다른 나라에서는? 갑자기 도로에 코끼리가 나타났다면? ... 웃긴 질문이지만 이런 질문에 다 대답을 해야 한다. 이 것이 모빌아이가 세계 최고 수준의 기술을 가지고 있음에도 지금도 전 세계에서 거의 모든 차종을 가지고 주행데이터를 쌓고 있는 이유이다. 그러니 완벽한 데이터로 실험실 안에 얻은 성능만을 보고 환상에 도치되어 있지 말아야 한다.

3. 아직도 정신력 타령하는 한국 축구와 데이터분석을 통해 더 강해지는 독일 축구 사이: 제조업의 성공만으로 바라보는 인공지능 기술 세계

한국도 그렇지만 많은 기존 대기업들은 제조업의 성공을 바탕으로 일어선 기업이 많다. 그렇다 보니 이러한 제조업 성공 역사 속에서 제조업 성공 방정식이 기업의 성공 방정식으로 이루어져 있는 곳이 많다. 이런 상황에서 소위 말하는 우리나라 최고 기업의 최고 연구소에서 흔히 들리는 말은 "마른 걸레도 짜면 나온다". 야근, 특근, 밤샘으로 혁신을 가져올 수 있을 거라 생각한다.

그러나 불행히도 이 시대는 그 성공의 방정식에서 벗어나고 있다. 기존 제조업의 가장 큰 성공 전략은 페스트 팔로우라고 생각한다. 가장 빠르게 기존 기술을 따라 만들고 그걸 더 싸게 많이 만들어내는 전략이다. 한 회사가 10명의 박사급 인력을 1년간 투입해서 ILSVRC 대회용 알고리즘을 만들었다고 치자. 1년이라는 짧은 기간 세계 7위 정도의 기술을 만들었다고 치자. 박사급 인력이 10명이 1년간 들어갔으므로 20-30억이 투입된 프로젝트라고 할 수 있다. 그러나 이 기업이 7위를 한 날 세계 1위는 자신의 논문을 공개한다. 그리고 얼마지나지 않아 소스를 공개한다. 또 얼마지나지 않아 그 방법을 분석하고 개선한 버젼을 공개한다. 그러자 또 다른 곳에서 그 것을 개선할 수 있는 방법을 공개한다. 지금 인공지능 학문은 이렇게 발전한다.

빠르게 동일한 것을 만드는 것은 기존 제품의 가격만 올리는 연구소의 역할에서 벗어날 수 없다. 많은 인력을 투입하고 집중적으로 일을 시켜 빠르게 동일한 것을 만드는 것이 아니라 새로운 것을 만들고 문제를 정확히 읽고 그 것을 해결하기 위해 데이터를 분석한다. 소스만 있으면 기술력이 있다고 외치던 시대에서 공유의 시대로, 대량 생산에서 개인화된 소비를 지원하는 시대로 전환되고 있다. 이러한 시대에서는 작은 문제라도 정확히 분석하고 발견하는 능력이 요구된다. 불행히도 그런 창조적 작업에 정신력이 강조되진 않는다. 야근과 특근... 분석이 아닌 무리한 투입은 그냥 학습의 오버피팅만을 불러올 뿐이다.

4. 실제 아는 것과 아는척하는 것의 사이: 한발짝 더 들어가기의 어려움...

공유의 문화 안에서 발전한 딥러닝 기술은 많은 소스와 논문들이 공개되고 있다. 이에 이를 사용하기는 어렵지 않다(물론 GPU는 비싸서 돈이 든다..). 그래서 딥러닝을 조금만 공부한 사람들은 어렵지 않다, 조금만해도 좋은 성능을 보여준다, 기존 기술은 필요없을 정도다... 라는 발언들을 한다. 물론 이는 사실이다. 그러나 이들 대부분 레이어 하나 바꾸지 않고 공개된 네트웍에 데이터만 바꾸어 사용하고 있다. 그리고 깃헙에서 받은 소스를 그렇게 돌려보고는 말한다. 우리도 딥러닝을 하고 있다. 우리도 기술력을 가지고 있다.

VGG넷과 같은 네트웍은 잘 만들어지고 일반성도 뛰어나 다른 분야에 적용해도 놀라운 성능을 보여준다. 이 때 생각해 봐야 한다. 그럼 당신들도 딥러닝을 하고 기술력이 있다고 한다면 이 분야에 기술 장벽이 무엇인지. 누구나 와서 쉽게 이정도 할 수 있는 일을 하고 있다고 말하고 있는 것은 아닌지. 이 것으로 사업을 한다면, 누구나 깃헙에서 받은 소스를 돌려보고 들어갈 수 있는 시장에 들어가는데 돈을 투자하라고 말하는 것은 아닌지.. 물어야 한다.

다행인지는 몰라도, 이렇게 단순히 적용하여 풀수 있는 문제는 제한적이다. 적용하여 문제를 확인하고 한 걸음 더 들어가야 실제로 쓸 수 있는 성능이 나오는 경우가 많다. 그리고 이 한걸음이 기술력이고, 이 한걸음이 후발 주자들을 따라올 수 없게하는 장벽이다. 그러나 이 장벽은 정말 힘들고, 정말 기술력이 있어야 한다. 단순히 적용해봤던 딥러닝 네트웍을 이해해야 하고, 자신의 데이터를 이해하고 분석해야 한다. 특히 자신의 데이터를 확실히 이해하고 분석할 수 있는 능력은 경험이란 이름의 기술력으로 쌓이게 된다. 이런 경험을 쌓고 나아가는 곳이 되어야 한다.

keyword