brunch

You can make anything
by writing

C.S.Lewis

by 비앤빛 AI 연구소 Sep 03. 2019

인공지능의 성패를 가르는 기준

데이터의 질을 고민할 때


영화 <마이너리티 리포트>에는 살인사건을 미리 예측하는 시스템-프리 크라임-이 등장합니다. 범죄의 유형과 장소, 시점을 데이터로 수집해 범죄를 저지를 가능성이 높은 사람을 찾아냄으로써 살인을 예방하는 것이지요. 

영화가 그럴듯하게 느껴지는 것은 그들이 데이터를 기반으로 하고 있기 때문입니다. 범죄를 예측하는 세 명의 예지자는 인공지능을 의인화한 셈이라고 할 수 있습니다. 그렇다면 


우리는 인공지능을 어디까지 믿을 수 있을까요?

훌륭한 인공지능은 무엇이든 대체할 수 있을까요? 

그렇지 않습니다. 각종 언론매체에 비친 의료 인공지능은 당장이라도 의사들을 몽땅 해고시켜버릴 것 같았지만 현실에서는 그리 큰 영향을 미치지는 않았습니다. 큰 유명세를 떨쳤던 모 글로벌 기업의 의료 시스템도 시간이 흐르고 여러 검증을 통해 아직은 시기상조라는 회의적인 평가들을 받고 있다는 점을 우리는 고려해야 합니다.


심지어 최근에는 2016~2017년 사이에 발표된 927개의 의료 연구에 사용된 데이터 중 71개의 데이터를 테스트해본 결과, 최신의 복잡한 인공지능 알고리즘들이 전통적인 알고리즘에 비해 더 나은 성능을 보이지는 못했다는 연구결과가  나오기까지 했습니다. 

다시 말해 많은 의료 관련 상황에서 복잡한 인공지능 알고리즘의 효과가 없었다는 말입니다.




데이터의 불완전성


왜 많은 의료 관련 상황에서 인공지능이 실패했을까요? 


이는 데이터가 불완전(Incomplete)했기 때문입니다. 

인공지능을 간단하게 설명하면 주어진 데이터에서 우리가 보고자 하는 현상을 잘 설명할 수 있는 복잡한 패턴을 자동으로 찾아주는 것 정도로 말할 수 있습니다. 


예를 들어 어떤 환자의 암 발병 확률을 예측하고자 한다면, 인공지능은 주어진 데이터에서 환자의 가족력 유무, 식습관, 수면시간, BMI 등의 요소들이 암의 발병 예측에 중요한 요소인지 아닌지 그리고 어떤 패턴으로 영향을 미치는지를 찾아내고, 이를 바탕으로 환자의 암 발병확률을 예측합니다. 

여기서 주목해야 할 부분은 ‘주어진 데이터에서’입니다. 인공지능은 연금술이 아닙니다. 그저 데이터에서 의미 있는 정보 또는 복잡한 패턴을 사람보다 더 잘 뽑아낼 뿐이지, 데이터가 담고 있는 정보와 무관한 현상을 유추해낼 수는 없습니다. 



즉, 패턴이 없는 데이터에서는 패턴을 찾아낼 수 없습니다. 만약 암 예측에 있어 가족력이 매우 중요한데 그 가족력이 데이터 안에 담겨있지 않다면 인공지능의 정확도는 큰 폭으로 하락할 수밖에 없습니다.




핵심은 데이터의 질


왜 구글의 당뇨성 망막병증은 됐는데, 다른 문제는 안될까요? 


구글의 연구와 다른 의료 관련 인공지능 사이에는 어떤 차이가 있을까요?

데이터의 질과 양의 차이 때문인데요, 이 둘 중에 더 큰 문제가 되는 것은 의외로 ‘데이터의 양’이 아니라 ‘데이터의 질’입니다. 


“우리 병원은 수십만 건의 ‘빅데이터’를 갖고 있기 때문에 인공지능을 하기에 적합해 보입니다.”


아마 의료계뿐만 아니라 인공지능과 관련된 업계에 계신 분들이라면 공통적으로 많이 들어본 이야기일 것 같습니다. 그러나 정작 중요한 것은 ‘데이터가 몇 건 있는지’가 아닌 ‘필요한 데이터를 모으고 있는지’입니다. 그럼에도 현재 많은 병원들이 데이터의 양적인 측면에만 초점을 맞추는 경향이 있습니다. 



그럼 반드시 필요한 데이터를 모으고 있는지 여부를 어떻게 판단할 수 있을까요?

앞서 소개한 구글의 사례에서 데이터로 사용된 안저 사진에는 망막병증을 진단하는데 필요한 대부분의 정보가 담겨 있습니다. 그건 의사들이 안저 사진만을 갖고도 망막병증을 진단할 수 있다는 점을 보면 알 수 있습니다.

 

좀 더 쉽게 설명하면 질 좋은 데이터는 의사가 진단할 때 필요로 하는 모든 정보가 담긴 데이터를 의미합니다. 이러한 맥락에서 현재 의사의 진단 결과를 앞지르는 인공지능은 주로 영상(X-ray, MRI)이나 시그널(ECG) 데이터 중심의 판별 모형이 되고 있습니다. 이러한 분야들은 의사들이 주어진 데이터만을 이용해서 진단을 내릴 수 있는 분야라는 공통점을 갖고 있습니다. 


그러므로 만약 인공지능 도입에 실패했거나, 도입을 고려중이시라면 먼저 소유하고 있는 데이터가 진단에 필요한 필수 정보들을 충분히 담고 있는지부터 살펴봐야 합니다.




참고 자료 


의료 인공지능 시스템에 대한 기대와 현실 


최신의 복잡한 알고리즘이 더 나은 것은 아니다

A systematic review shows no performance benefit of machine learning over logistic regression for clinical prediction models




와튼스쿨 안대환 박사

서울대에서 경영학을 공부하고 지금은 와튼스쿨에서 인공지능의 산업적 적용을 연구하고 있습니다. 게임이나 온라인 상거래 등 실제 적용 가능한 분야의 연구를 주로 진행했으며, 비앤빛과 시력교정 인공지능 연구를 진행하고 있습니다. 


에디터: 이명제

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari