[기고] 인공지능이 이끌 바이오·의료 혁명

데이터만으로는 경쟁에서 앞서갈 수 없다

by 신동현

Sep 11. 2023

인공지능을 접목한 바이오 신약개발을 주도하고 있는 서울대학교 컴퓨터공학부 김선 교수. 그의 말을 빌리면, 최근 인공지능의 주요 쟁점은 대부분 데이터에 중점을 두고 있다고 한다. 그러나 단순히 데이터만 수집하는 것으로는 선두주자들과의 경쟁에서 앞서갈 수 없다. ‘패스트 팔로워’에 그친다면, 언젠가는 경쟁에서 도태된다. 인공지능 분야를 선도하는 ‘퍼스트 무버’가 되려면, 무엇을 준비해야 할까.

인공지능, 사회 ‘혁신’이 아닌 ‘혁명’으로

오늘날 인공지능의 기술발전도를 먼저 짚고 넘어가 보자. 쉽게 말해 아직까지는 사람에 비해 일반 작업(General Tasks)은 뒤처지지만, 특정 작업(Specific Tasks)은 AI가 사람을 이미 앞질렀다. 즉, 일반 작업까지는 기술 수준이 사람을 능가하지 못했다는 소리다.

바둑을 예로 들어보자. 알파고가 사람을 앞지른 것은 이미 한참 전의 일인 것임은 대부분 수긍할 것이다. 이처럼 매우 빠르게 발전하는 인공지능이지만, 특정 작업을 잘 수행하려면 사람과 마찬가지로 훈련이 필요하다.

머신러닝은 인공지능 분야의 ‘엔지니어링’이라 할 수 있다. 이런 기계학습에는 추론과 관련된 여러 기법들이 사용되고 있다. 이 분야에 있어 우리에게 가장 익숙한 것이 바로 ‘딥러닝(Deep Learning)'. 최근 10년 동안 딥러닝이 엄청난 발전을 거듭하며 우리 삶에 상상할 수 없던 변화를 이끌어낸 것처럼, 앞으로도 인공지능이 가져올 혁명은 매우 크다고 볼 수 있다.

데이터와 인공지능

인공지능의 발전성과는 정말 괄목할 만하다. 이 시작은 바로 1996년. 체스에서 인간을 이긴 딥블루(Deep Blue)에서 비롯되었다. 딥블루는 새로운 탐색 방법과 빅데이터를 이용해 당시 체스 세계 챔피언 게리 카스파로프(Gary Kasparov)를 이긴 인공지능이다. 이후 IBM 왓슨(Watson), 구글의 알파고(AlphaGO), 알파제로(AlphaZero), 람다(LaMDA) 등 인공지능이 개발되며 세상을 놀라게 했다.

IBM의 왓슨은 국내에서는 다소 생소한 인공지능일 수 있다. 여기에는 책이나 문헌을 읽고 거기서 간단한 추론을 할 수 있는 기술이 적용되어 있다. IBM은 왓슨을 만든 후 미국 퀴즈쇼 ‘제퍼디(Jeopardy)’에 출연시켰다. 여기서 당시 최다 우승자, 최대 상금 수상자와 경쟁했는데, 왓슨이 3,600달러를 획득하는 동안 두 사람은 각각 0, -200달러의 스코어를 기록할 뿐이었다.

IBM은 왓슨의 기술을 이용해 다양한 사업도 추진했었다. 레스토랑 셰프, 호텔･공항 등의 로봇 컨시어지 등이다. 그중 가장 야심차게 추진했던 것은 암 진단이다. 이를 위해 뉴욕 의대 학생들이 사용하는 교과서를 읽게 하고, 인턴 과정도 수료시켰다. 또한, 최근 인공지능이 사람을 대체할 가장 유력한 분야로 예상되는 법조, 즉 변호사에도 진출시켰다. 그러나 왓슨의 한계는 명확했다.

‘너무 일반적(Too General)'이란 한계가 발목을 잡았고, 결국 IBM은 사업을 철수시켰다. 일반적이란 것은 우리 사회 전반에 걸쳐 다양한 모습으로 적용･응용이 가능하다. 그러나 달리 말하자면, 바로 이 ‘일반적’인 추론이 왓슨의 발목을 잡은 것이다.

바둑을 제패한 인공지능

인공지능은 3층 구조로 구성돼 있다. 이 층을 굉장히 많이 쌓은 것이 바로 딥러닝이다. 단순히 층을 많이 쌓는 것은 그리 어려운 기술이 아니다. 과거 컴퓨터는 성능이 너무 낮아 층을 너무 많이 쌓으면 인공지능을 훈련시킬 수 없었을 뿐이다. 비로소 컴퓨터 기술이 비약적으로 발전하기 시작하자, 인공지능 학습에 이 딥러닝 기술을 적용시킬 수 있게 됐다.

알파고를 이해하려면 강화학습에 대한 이해도 필요하다. 지속적으로 변화하는 상황을 부여해 인공지능을 학습시킨다. 계속 변화하는 상황은 바로 ‘환경’이며, 강화학습은 이 ‘환경’이 계속 바뀌는 것을 지속적으로 업데이트하는 것이다. 그런데 강화학습엔 전통적으로 큰 문제가 있다. 학습은 지속하다 보면 꾸준히 좋아지는 것을 전제로 한다. 기계를 학습시키면, 성능은 조금씩 좋아져야 할 것이다. 그러나 전통적인 강화학습은 훈련을 거듭할수록 성능의 상승과 하강이 반복되는 경향을 보인다.

그렇기에 알파고를 언급하려면, ‘아타리(Atar)’의 벽돌깨기 게임을 함께 이해해야 한다. 구글은 알파고 이전 인공지능 아타리를 학습시킬 때 벽돌깨기 게임을 이용했다. 사람에게 이 게임을 가르친다고 가정해 보자. 게임을 해보지 않은 사람일지라도 룰을 설명해 준다면, 익숙해질수록 점점 더 많은 벽돌을 부수는 방향으로 공을 보낼 것이다. 그런데 아타리를 학습시킬 땐, 이를 모르게 하여 학습시켰다. 즉, 게임의 원리와 내용은 알려주지 않은 채 화면만 보고 학습하도록 만든 것이다. 그런데도 아타리는 학습을 거듭하며 보다 많은 벽돌을 부술 수 있는 방향으로 공을 보내기 시작했다. 전통적 강화학습에서 성능의 상승과 하강을 반복하던 인공지능이, 정말로 성능이 좋아지는 방향으로 학습을 할 수 있게 된 것이다. 이 기술이 적용돼 탄생한 것이 바로 알파고다.

다시 바둑으로 돌아오자. 알파고는 어느 자리에 돌을 둘지 결정할 때, 몇 수 앞을 내다보고 착점하지 않는다. 랜덤(데이터로부터 학습한 랜덤) 시뮬레이션을 통해 모든 경우의 수를 계산한다. 그 뒤 가장 승률이 높은 위치에 착점하도록 학습됐다. 세기의 대결이었던 이세돌과 알파고의 대결. 만약 구글이 알파고의 시뮬레이션 횟수를 더 늘렸다면, 이세돌의 1승은 아마 없었던 일이었을지도 모른다.

‘경험’을 학습하는 인공지능

요즘의 바둑은 AI라는 절대 고수와 함께한다. 과거 중요 대국이 끝나면, 여럿이 모여 복기를 했다. 여기서 수많은 토론이 펼쳐졌다. 그런데 AI가 한 장면마다 수많은 수를 제시하기 시작하자, 복기에 참여한 이들은 더 이상 토론하지 않는다. 이들은 누가 정답을 말했고, 나의 착점은 몇 점짜리였는지 확인한 뒤 다음 수로 넘어간다. AI의 정답을 의심하는 이는 아무도 없다.

얼마 전 구글에서 놀라운 발표를 했다. 알파고는 고수가 둔 기보 수십만 판을 강화학습하도록 한 인공지능이다. 반면 알파제로는 데이터 학습 없이, 바둑의 규칙만을 학습시킨 채 알파고와 바둑을 두게 했다. 여기서 알파제로가 알파고를 상대로 전승을 거두었다는 것이다. 이미 인간의 한계를 뛰어넘은 인공지능이 바둑계를 제패했다.

인공지능이 인간의 ‘경험’을 학습하는 것은 이미 정점에 도달했다. 2022년 사람과 람다의 대화를 살펴보자. AI와의 대화라고는 생각할 수 없을 정도로 매우 자연스럽게 대화가 이어진다. 인공지능이 ‘정답이 없는 영역’에서도 두각을 나타내기 시작한 것이다.

기계가 정말로 인간의 경험을 학습할 수 있는지에 대한 영역 자체는 아직 미지의 세계다. 인공지능 분야에서 딥러닝이 던지는 화두가 중요한 이유는, 인공지능의 ‘경험의 학습’이 아닌 ‘추론’에 이슈가 있었기 때문이다. 단순한 정보 추론 기법이 훨씬 더 발전하게 되면, 지금보다 더 큰 파장을 일으킬 것이다.

인공지능이 가져올 의료 혁명

지구상에는 약 75억 명이 살아간다. 그리고 이 사람들이 가진 DNA는 약 32억 개에 달한다. 수학적으로 계산해 본다면, 우리가 가진 DNA의 경우의 수는 4의 32억 승이다. 인간은 바로 이 4의 32억 승의 정보를 인코딩한 생명체며, 그렇기에 어떤 사람도 똑같은 DNA를 가지고 있을 수가 없는 것이다. 그렇기에 유전체 정보는 상상을 초월할 정도로 많은 가능성을 가지고 있다. 이런 유전체 정보를 사용한다는 것은 먼 미래 이야기가 아니다. 결국 이를 어떻게 이용하느냐는 인간의 지혜가 필요하다.

그렇다면 인공지능이 암을 진단할 수 있을까? 결론부터 말하자면 진단이 가능하다고 말하고 싶다. 통상의 진료는 의사가 가진 경험을 토대로 환자의 병을 진단한다. 인공지능 역시 학습을 통해 충분히 진단이 가능하다. 이미 전 세계 병원에서 영상 이미지를 통한 진단은 대부분 AI가 처리하고 있다. 과거 의사들은 경험에 의존해 환자들을 진료했다. 증거기반 의학은 여기서 시작됐다. 보다 정확한 진단을 고민하다, 여러 검사 결과를 기반으로 치료하기 시작한 것이다. 이것이 우리나라에서 가장 잘하고 있는 대증요법 분야다. 하지만 이보다 상위 개념인 원인치료 분야에서는 아직 부족하다. 원인치료란, 증상이 있을 때 그 증상에 대한 치료를 행하는 것이다. 이런 원인치료보다 상위의 개념이 바로 예방하는 것이고, 실제로 인공지능 의료의 발전은 이쪽으로 이루어지고 있다. 전 세계 모든 사람을 대상으로 하는 시장이 열리고 있는 것이다.

신약개발 분야에서도 인공지능의 역할이 매우 중요해지고 있다. 기존의 장비, 측정기술은 단백질 구조 샘플 확보가 매우 어렵다는 한계를 지니고 있다. 즉, 데이터가 부족해 풀 수 없던 문제가 많다는 거다. 그런데, 유전자 진화 정보를 인공지능 구조에 잘 집어넣어 만들었더니, 어려운 문제를 풀어내는 것은 물론 예측까지 가능한 지경에 도달했다. 세포에 기록된 모든 데이터는 실험 한 번으로 측정 가능하다. 신뢰성도 매우 높다. 그러나 초고차원 데이터다 보니 이 문제를 다뤄본 사람이 없는 것이다. 엄청나게 방대한 데이터를 분석하는 것. 현재 기술로는 아직 어렵지만, 인공지능이 적용될 수 있는 분야를 점점 더 많이 찾아가고 있다.

한국경영혁신중소기업협회 소식지 <2i> 에 게재한 기고글을 업로드합니다.

https://www.mainbiz.or.kr/mainbizinfo/ebook.asp

한국경영혁신중소기업협회

한국경영혁신중소기업협회는 중소기업의 지속성장을 지원합니다.

https://www.mainbiz.or.kr/mainbizinfo/url

keyword