[서평] 최윤섭, <의료 인공지능>
이세돌과 알파고의 대국은 인류의 뒤통수를 치는 사건이었다. 사람들은 갑자기 인공지능에 대해 두려움이 섞인 복잡한 감정을 표출하기 시작했다. 참 이상한 일이다. 이미 10년 전에 인공지능은 체스 세계 챔피언 가리 카스파로프를 물리쳤으며, IBM의 '왓슨'은 퀴즈쇼 '제퍼디!'에서 역대 최고 챔피언 두 명을 상대로 압도적인 점수 차로 이겼다. 왓슨은 퀴즈쇼를 졸업하고 의학 분야에 뛰어들었는데, 그 첫 분야는 암 진단이었다. 2016년 가천대 길병원을 시작으로 현재 국내 대형 병원 여섯 곳이 암 진단용 왓슨 서비스를 이용하고 있다.
내부자들에게 인공지능 혁명의 해는 2012년이다. '이미지넷 이미지 인식 대회'라는 인공지능 세계 대회에서 토론토대 제프리 힌튼 교수팀이 경쟁자들을 압살하고 우승한 것이다. 다른 팀들이 정확도 73%대에서 소수점 경쟁을 벌이는 상황에서, 힌튼 교수팀의 '알렉스넷'은 정확도 83.6%라는 압도적인 정확도를 선보였다. 이미지 인식의 새로운 시대를 연 이 기술의 이름은 '합성곱 신경망', 흔히 CNN이라고도 불리는 것으로, 딥러닝의 일종이다.
인공지능의 현재
<의료 인공지능>에서 저자 최윤섭은 의료 인공지능을 세 가지로 분류한다.
* 복잡한 의료 데이터에서 의학적 통찰을 도출하는 인공지능
* 이미지 형식의 의료 데이터를 분석 및 판독하는 인공지능
* 연속적 의료 데이터를 모니터링하여 질병을 예측하는 인공지능 (65쪽)
놀라운 일이지만, 인공지능은 이미 세 가지 유형 모두에서 발군의 실력을 보여주고 있다. 어느 정도냐면, 대개의 경우 인공지능은 전문의보다 더 정확한 판단을 내린다. 예컨대 이미지 판독에서 인공지능의 정확도는 이미 사람을 넘어섰다. 현재 가장 정확한 안면 인식 인공지능은 중국 바이두가 소유하고 있다. 이 인공지능의 정확도는 99.77%에 달한다. 바이두의 안면 인식 인공지능에게 6천 쌍의 얼굴 사진을 보여주고 동일인 여부를 판독하게 했다. 인공지능은 불과 14쌍만을 잘못 판단했다.
그런데 알고 보니 바이두의 인공지능이 틀렸다고 생각했던 14쌍 중에, 5쌍의 사진은 오히려 정답에 오류가 있었고, 실제로는 인공지능이 정확했던 것으로 드러났다. (197쪽)
이미지 판독은 엑스레이부터 조직검사까지 광범위한 분야에서 활용되는 의료기술의 핵심 영역이다. 하루 수백 장의 엑스레이를 판독해야 하는 영상의학과 전문의가 피로로 인해 잘못 판단할 가능성을 생각해보면, 딥러닝은 인류에게 재앙이 아니라 선물이다.
병리학이란 떼어낸 세포 조직을 고배율 현미경으로 들여다보고 병증에 대한 최종 판단을 내리는 학문이다. 임상에 있어서 병리학과의 진단은 어떤 경우에라도 정답으로 간주된다. 구글의 딥러닝 아키텍처인 '인셉션'을 사용한 실험에서, 병리학 전문의는 3.5%의 에러율을 보였지만, 인공지능은 더 낮은 2.9%의 에러율을 보였다. 그런데 인공지능과 사람은 반드시 적대적인 입장이어야 할까? 이 실험에서 인공지능과 전문의가 협력하여 내린 진단의 에러율은 0.5%에 불과했다.
실시간 모니터링에 있어서도 피로와 실수에 노출된 사람에 비해 인공지능은 우월하다. 서울아산병원은 인공지능을 활용해 발생 한 시간 전에 부정맥을 예측할 수 있었다. 심장마비의 경우에는 무려 하루 전에 그 발생을 예측하는 정도에 이르렀다. SBS 기사에 따르면 이 기술로 한 명의 환자가 이미 목숨을 구했다고 한다.
딥러닝은 '암묵지(tacit knowledge)'조차도 배울 수 있다. 영화나 만화에 나오는 신의 손을 가진 의사가, '말로 설명하긴 어렵지만 그럴 것 같았어'라고 말하는 바로 그것이 암묵지다. 딥러닝은 기존의 기계 학습과는 달리 학습 방법을 인간이 정해주지 않는다. 방대한 데이터와 정답 목록을 대조하여, 스스로 특징을 찾아낸다.
그 특징은 때로 인간의 입장에서는 이해할 수 없는 것이라는 문제가 있지만, 이는 결국 암묵지에 해당하는 지식도 학습할 수 있다는 것으로도 볼 수 있다. (301쪽)
의료 인공지능과 관련한 첫 번째 논란은 인공지능 대 의사라는 구도에 갇혀있다. 길병원 환자들을 상대로 진행한 설문조사에서, 설문은 의사와 왓슨의 진단이 다를 경우 어느 쪽을 신뢰할지 물었다. 결과는 어땠을까? 100%. 단 한 사람도 빠짐없이 모두 왓슨의 진단을 신뢰한다고 대답했다. 이것은 3분 진료라는 한국 의료 현실을 반영한 결과일지도 모른다. 인공지능은 피로를 느끼거나 게으름을 피우지는 않을 것이니까 말이다.
그러나 앞서 사례로 든 병리학 진단 실험에서 보듯, 의사와 인공지능이 단독으로 판단에 나서야 할 이유는 어디에도 없다. 디자이너에게 CAD가 강력한 도움이 되듯, 의사는 인공지능의 도움을 받아 한층 더 정확한 진단을 내릴 수 있다. 레이 커즈와일이 말하는 특이점이 아직 도래하지 않은 현시점에서, 우리는 의료 인공지능이 인류를 배신할 가능성을 생각하기보다는, 인공지능을 활용하여 더 나은 의료 서비스를 가능케 할 방법에 대해 생각해야 한다.
인공지능의 미래
더 정확한 인공지능에 의해서 의사는 사라지고 말 것인가? 많은 이들이 차가운 인공지능에 대비하여 의사의 따뜻한 손길을 강조한다. 그런데 라포(rapport) 형성에 있어서도 인공지능이 우월하다는 실험 결과가 이미 나와 있다. 정신과 상담에서 환자는 수치심 또는 예의 때문에 의사에게 솔직하게 말하는 것을 꺼리기도 한다. 그러나 인공지능이 상대라면 그럴 일이 없다.
자신이 인공지능과 상담한다고 '믿는' 환자들은 인간과 상담한다고 '믿는' 환자보다 더 솔직하게 이야기했으며, 자신의 치부를 드러내는 것도 덜 두려워했다. 또한 슬픈 감정도 더 잘 드러냈고, 상대에게 일부러 좋은 인상을 주기 위한 노력도 덜 했다. (324쪽)
인공지능이 사람의 심리를 판단할 수 없을 것 같은가? 심리 파악은 결국 특징 파악이다. 알고리즘에 따라 판단하는 인공지능은 인간과 달리 실수에 의한 오류를 범하지 않는다. 앱스토어에 'Moodies'를 검색해 보라. 20초만 말을 들려주면, 당신이 어떤 기분인지 알려준다. 이게 무려 무료 앱이다.
외과의 경우도 인공지능의 위협에서 자유롭지 않다. 자동수술 기계 STAR는 지정된 라인에 더 가깝게 절개하고, 주변 조직에 상처도 덜 입힌다. 이쯤 되면, 자율주행 자동차의 사례가 의료계에도 닥치지 않으리라고 생각하기도 어렵다. 수동운전이 불법화되듯, 인간의 손에 의한 수술도 불법화될 수 있다.
인공지능은 의사의 역할 일부를 대체할 것이고, 어떤 경우에는 새로운 역할을 만들어낼 것이다. 그리고 대개의 경우 의사의 역할을 변화시킬 것이다. 인공지능이 의사의 80%를 대체할 것이라는 '막말'로 유명한 비노드 코슬라는 이렇게 말하기도 했다.
"인공지능을 이용하면 순식간에 인간보다 더 높은 특이도와 민감도로 판독을 받을 수 있다. 나는 이제 이런 인공지능 없이 영상의학과 판독을 하는 것이 범죄행위와 같다고 생각한다." (287쪽)
어그로의 달인다운 막말이다. 하지만 생각해보자. 코슬라는 인공지능 '대신' 의사가 영상의학과 판독을 행하는 것이 범죄라고 말하지 않았다. 인공지능의 '도움 없이' 판독을 하는 것이 범죄행위라고 말했을 뿐이다. 이는 복식부기를 하지 않고 기장을 하는 것이 범죄행위라고 말하는 것과 무엇이 다른가?
스프레드시트 소프트웨어가 발명되고 나서 이제는 모든 회계분석사가 스프레드시트를 사용한다. 이걸 사용하지 않더라도 범죄는 아니다. 하지만 남들보다 훨씬 더 떨어지는 생산성 때문에 시장에서 퇴출당할 것이다. 발명 초기에 에어백은 옵션이었다. 그러나 목숨을 돈으로 매길 수는 없는 법. 에어백이 없는 차량은 소비자의 외면을 받았고, 이제 에어백이 없는 차량은 불법이다.
강한 인공지능, 즉 스스로 사고하며 다양한 문제에 대처하는 인공지능은 아직 갈 길이 멀다. 의료 인공지능은 약한 인공지능, 즉 한 가지 문제를 푸는 데 전문화된 인공지능이다. 이런 인공지능은 도구다.
도구를 어떻게 사용하느냐는 결국 도구를 사용하는 사람에 달렸다. 현미경도, 전기 메스도 의사를 퇴출시키지 않았고, 오히려 의료의 질을 높이고 의료시장을 키웠다. 인공지능이라고 다르게 볼 이유가 없다. 특이점이 머나먼 미래인 아직까지는 말이다.