챗GPT의 등장에 요즘 더욱 ‘핫'한 이슈로 떠오른 인공지능(AI). 오늘은 의료인공지능 관련 분야에서 ‘임상통계학자 (Biostatistician)‘으로 활동하고 있는 곽수영님의 인터뷰입니다.
O 안녕하세요, 수영님! 오늘 인터뷰에 응해 주셔서 감사합니다. 임상통계학자라는 직업에 대해서 많은 분들이 과연 어떤 직업인지 궁금해하실 것 같아요. 자기소개와 함께 임상통계학자가 하는 일에 대해 좀 더 쉽게 말씀해 주실 수 있을까요?
>네, 안녕하세요. 저는 임상통계학자 곽수영이라고 합니다.의료AI 제품의 이용이 영상의학과 의사와 같은 실제 사용자에게 효과가 있다는 근거를 통계분석을 통해 제시하는 일을 회사에서 맡고 있습니다. 쉽게 말해, 통계라는 도구를 사용해서 의학이라는 대상(분야)에 적용하는 것입니다.
O 요즘 AI가 많이 뜨는 이슈인데, 의료AI는 무엇인지 궁금합니다.
> 의료 AI는 쉽게 말해서 의료 분야에 AI를 적용한 것이라고 할 수 있습니다. 현재는 흉부엑스레이, 유방 촬영영상, 병리학 이미지와 같은 의료 영상에 딥러닝이라는 AI 기술이 적용된 제품들이 의료 AI 분야에서 많이 사용되고 있죠.
의료 영상에 AI를 적용하면, 흉부 엑스레이나 유방 촬영영상에서 암과 같은 병변을 더 쉽게 확인한다거나 병리 이미지의 분석을 통해 해당 환자에게 맞춤형 항암제를 처방하는 데 활용할 수 있어요. 예를 들면, 표적치료 전에 해당 항암제가 환자에게 얼마나 잘 맞을지 미리 알아볼 수도 있는 것이죠.
ㅇ 맡고 계신 업무인 통계적 분석은 이 중 어떤 과정에서 필요한가요?
> 네, 저는 Clinical Research 팀에서 일하고 있는데요, 팀에서 제품의 사용을 평가할 임상 연구(Clinical Research)를 계획하고 전문가 섭외를 포함하여 연구를 진행하면 데이터가 수집이 됩니다. 이 데이터들을 분석할 때 통계가 사용되고, 제가 하는 일은 수집된 데이터의 분석 결과를 정리하는 것입니다.
ㅇ그렇다면, 통계적 분석을 가능하게 만든, 통계학이란 어떤 학문이라고 할 수 있나요?
> 가설을 바탕으로 이것이 통계학적으로 유의미한가? 아닌가?를 분석하고 합리적인 결정을 내릴 수 있도록 돕는 것이죠. 통계(학)는 이론, 가설, 현상에 대한 합리적인 결론을 얻기 위해서 데이터를 정리하고 요약하는 방법이라고 할 수 있어요. 통계 분야를 좀 더 잘 이해하고 싶은 분들에게는 김재광 교수님의 ‘통계란 무엇인가?’를 추천드립니다.
O 통계학이 합리적인 결정을 돕는 도구라는 건 그동안 생각해 보지 못했었는데, 참 새로운 관점이네요! 수영님이 전공하신 임상통계학에 대해 아직 많이 알려져 있지 않은데, 어떻게 이 길을 처음 선택하시게 되었는지 궁금합니다.
> 사실 저의 흥미와 관심은 ‘생물학'이었어요. 그래서 처음에는 대학에서 신문방송학 공부를 시작했지만, 중간에 진로를 바꿔서 미국 학부에서 생물학을 전공하게 되었지요. 그런데, 공부를 하던 중에 동물실험이 저에게는 맞지 않는다는 것을 알게 됐죠.
분자생물학 실험실에서 파트타임으로 업무보조를 할 기회가 있었는데 그 실험실은 Knock-out mice라고, 특정 유전자를 제거한 쥐를 연구하는 곳이었어요. 그곳에서 실험 쥐의 꼬리를 약간 잘라 유전자 제거 여부를 확인해 본다거나, 실험 쥐를 관리하는 업무를 잠깐 맡았었는데 그때 제가 실험기구를 사용해서 살아있는 동물에 대한 실험을 하는 것이 적성에 참 맞지 않는다는 것을 깨달았어요.
O 그러셨군요. 진로와 관련된 어떤 길을 가다가 꼭 해야 되는 것으로 여기는 과정이랄까, 그런 부분에서 맞지 않다고 느끼거나 그 과정을 해내기 어려운 경우에 아예 그 길을 포기하는 경우도 있는데, 계속해서 원하는 공부를 하기 위한 방법을 적극적으로 알아보셨네요.
걷고 싶은 길을 갈 수 있는 방법을 찾는다는 것
> 네, 그래서 알게 된 것이 바로 임상통계학이에요. 제가 잠깐 경험했던 분자생물학 실험실에서처럼 시약, 동물, 미생물 배지 등을 사용하는 환경을 wet-lab이라고 하는데요, 저의 경우는 문서와 데이터, simulation 작업 등이 주가 되는 dry-lab 환경이 훨씬 잘 맞겠더라고요. 실제로도 컴퓨터로 작업하는 현재의 업무에 대한 만족도가 높습니다!
O 그러면, 생물학 전공자로서 어떤 과정을 거쳐서 임상통계학을 전공하실 수 있으셨나요?
> 우선, 미국 대학원에서는 임상통계학 (Biostatistics) 전공 지원자에게 수학 선수과목(다변량 미적분 및 선형대수학 수업) 이수를 요구하기 때문에 생물학부 과정을 마치기 전에 해당 과목 이수를 했어요. 그리고 대학원 입학을 위해 필요한 GRE 시험등을 학부 재학 중에 준비해서 열일곱 곳에 원서를 넣었습니다.
O 열일곱 군데의 대학원에 지원하셨군요!
> 네, 다행히 입학원서 접수 시스템이 있어서, 각 학교마다 일일이 개별적으로 원서를 작성하지는 않았던 것으로 기억해요. 보통 임상통계학 전공은 보건대학원이나 의대산하에 있습니다. 감사하게도 지원했던 대학원 중 여러 곳에 합격했고, 어떤 대학원에 가야 할지 최종 선택할 때는 아버지의 조언이 있었어요. 한국에서의 인지도나 졸업 후의 진로를 고려해 볼 수 있도록 조언해 주셨죠. 석사 졸업 후에는 한국에 돌아와 질병관리본부 기술연구원으로 첫 업무를 시작했습니다. 그 이후에는 임상시험수탁기관(CRO) 통계팀, 식약처의 의료기기 심사부를 거쳐 지금은 의료AI 분야 회사에서 근무하고 있습니다.
O 다양한 기관에서 임상통계학과 관련된 여러 업무를 해 보셨는데, 그렇다면 수영님의 경험을 바탕으로 혹시 통계학을 전공하는 학생들의 진로에 대한 조언을 해 주실 수 있을까요?
>네, 사실 학생 입장에서는, 제 경우를 돌아봐도 내가 무엇을 잘하는지 또는 내가 무엇을 좋아하는지에 대해 잘 모르는 것 같아요. 그렇기 때문에 오히려 ‘학생'이라는 기회를 살려서 특정전공이나 분야에 자신을 너무 제한하지 말고 (다양한 학문적, 경험적) 교류와 탐색을 많이 해 보라고 권하고 싶어요.
>통계 카페에서 관련 질문이 올라올 때도 저는 이렇게 조언을 해 주곤 해요. 방법론적으로 이야기를 한다면, 통계라는 것은 언어와 같이 도구(Tool)이기 때문에, 통계전공을 살려서 일을 하고 싶다면 대학원을 가는 것이 필요합니다. 학사 수준의 통계학 지식으로는 분석이나 직업선택이 제한적이거든요. 그리고 대학원에서는 특정분야에 해당되는 ‘00 통계학’이 아닌, ‘통계학’ 자체로 석사 전공을 하고, 내가 이것을 활용하고 싶은 분야가 금융인지, 의학인지, 마케팅 분석인지 사회과학 분석인지를 정하는 것이 더 선택의 폭이 넓죠.
O 미리 나의 선택의 폭을 제한하지 말고, 통계학이라는 도구를 더 정교하게 다듬은 후에 내가 원하는 분야에 적용하는 것이 좋다는 말씀이네요.
> 그렇죠. 적성이라는 것이 개인마다 달라서, 제 경우를 말씀드리면, 신문방송학, 그러니까 사회과학 쪽 공부를 할 때보다 자연과학인 생물학 쪽을 공부할 때 더 흥미가 있었어요. 아마 그 반대이신 분들도 있으실 거라고 생각합니다. 그래서, 자신이 가고자 하는 길을 미리 좁히지 말고, 본인이 흥미가 있는 주제를 함께 공부하면서 통계학은 석사 수준까지 전문지식을 쌓는 것을 권하고 싶어요.
> 그리고 (웃음 가득) 제가 고등학교 수학 시간에, 확률과 통계, 경우의 수 공부를…정말 안 좋아했거든요! 그때는 생각지도 못했어요. 통계학을 전공할 줄은! (그리고 통계학자가 될 줄은 더더욱)
극단적인 일이 생길 확률은 극단적으로 낮다.
O 지금까지 수영님이 지나왔던, 통계학자가 되기까지의 과정과 통계학이라는 학문, 그리고 업무에 대해서 이야기를 들었는데요, 그렇다면 ‘통계학’이라는 학문이 수영님의 삶에서 어떻게 도움이 되는지 알고 싶어요. 업무적인 것이 아닌, 삶을 살아가는 데 있어서요.
>오, 이런 질문은 처음인데요…통계학이 제 삶에 도움이 되는 점을 정리해서 말해보자면, ‘하늘이 무너질까봐 걱정하지 않게 되었다!’는 것이에요. 예를 들어, 요즘 뉴스에 보면 정말 놀랄 일도 많고 가슴 아프고 가슴 떨리는 일들도 빈번하게 보도되고 있어요. 그런 기사를 계속 보다 보면, 나도 모르게 걱정이 되기도 하는데, 통계학은 저에게 이렇게 말해줘요. “극단적인 일이 일어날 확률은 극단적으로 낮다."라고 말이죠.
O 아, 듣는 순간 바로 이해가 되는 표현이네요.
>좀 더 설명을 드리자면, 통계학 공부를 하다 보면 불확실성(uncertainty)과 변동성 (variability)에 대한 개념을 중요하게 배우게 되는데요, 사회현상도 그렇고 자연현상도 그렇고, 다양한 가능성을 가진 많은 일들이 실제로는 대개 정규분포를 따라 발생한다는 것을 알게 되었어요. 여기 이 그래프처럼요.
삶에서 일어나는 대부분의 사건들은 정규분포에 속해요
O 음, 꼭 어린 왕자의 글에 나오는 모자 그림, 코끼리를 삼킨 보아뱀 그림처럼 보이네요.
>그러고 보니 그렇네요. 하하. 아무튼 이 그래프가 바로 정규분포에 대한 일반적인 그래프예요. 일상에서 겪는 대부분의 일들은 이 정규분포의 중간 범위 안에 분포되어 있어요. 우리가 뉴스에서 보게 되는, “사건"들은 이 꼬리 부분에 속하는 것이죠. 그림이 보여주듯이, 아주 적은 확률이라고 말할 수 있어요. 이러한 이론적인 토대와 통계적인 사실을 알게 된 것이 저에게는 불확실성을 잘 받아들이게 해 주었어요.
O 불확실성이 있다는 것을 잘 받아들이게 해 주었다는 의미를 좀 더 설명해 주신다면요?
>네, 물론 극히 적은 확률로 일어나는 일들이 나에게 일어난다면, 1%가 내게는 100%가 되는 것이겠지만, 그러한 일이 발생할 확률 자체가 낮다는 것을 아는 것이, 혹시라도 그러한 사건이 발생할 수도 있다고 막연하게만 아는 것보다는 오히려 불안이 낮아지더라고요.
사실, 살다 보면 여러 불확실성(uncertainty)과 마주치게 되는데 이런 것들에 대해 발생할 가능성, 확률에 대해서도 알고 바라보면 마음이 좀 편안해진다고나 할까요?
O 아! 어떤 뜻인지 알 것 같네요. 저도 건강검진을 받으러 가면 결과지를 의사 선생님이 보시면서 “이 결과를 토대로 보면 어떤 어떤 질병이 발생할 확률은 3% 정도입니다.”라고 말씀하시는 것을 들은 적이 있어요. 당시에는 만에 하나의 경우에 대비하라는 뜻인지 의아했었는데, 이제 보니 그럴 확률은 극히 낮다는 뜻이었네요.
> 네, 바로 그거예요. 그래서 저에게는 통계학이 저에게 막연한 불안에 대해, 알 수없는 삶의 ‘해상도'를 높여주는 경험을 선사했어요!
통계학은 내 삶의 해상도를 높여주었어요
O와, 해상도를 높여 준다고 말씀하시니까, 저도 눈앞에 보이는 것처럼 한 번에 이해가 되네요. 내게 점점 가까이 다가오는 노랗고 하얀 물체가 흐릿해서 무엇인지 몰라 두려웠는데 선명해졌을 때, 저의 반려견인 것을 알게 되어 안심되고 기쁜 것처럼요.
> 네, 안전불감이 되면 안 되지만, 혹시 모를 일이라며 항상 불안에 ‘시달릴’ 필요는 없다는 것. 그러한 깨달음이 저를 자유롭게 해 주었어요. 그리고, 오히려 안전을 위해서 행동을 취하게 도와주었죠.
O 어떤 면에서 그런가요?
>통계적으로 극히 낮은 2% 확률 안에 내가 포함될 확률을 낮추는 행동을 하는 거죠.
예를 들어, 늦는 밤 시간에 홀로 인적이 없는 좁은 골목 안을 걷는 것은 범죄에 노출될 확률을 높일 수가 있고, 지속적인 흡연을 하는 것은 폐암에 걸릴 확률을 높일 수가 있죠. 이러한 것은 일반적으로도 알고 있는 것이지만, 실제로 개개인의 삶 속에서는 실천이 잘 되지 않는 것이기도 해요. 그렇기 때문에, 제 경우에는 반대로 지금부터라도 위험할 것으로 예상되는 상황은 미리 피하려고 노력한다든지, 정기적으로 규칙적인 운동과 건강한 식습관, 생활 습관을 통해서 나를 관리하게 되는 동기를 얻게 되기도 합니다.
미래는 모호하지만 행동은 지금 할 수 있다
ㅇ 그렇군요. 결국 막연한 일에 대한 불안은 ‘앎'을 통해 낮추고, 지금 내가 할 수 있는 일에 집중하면서 현재와 미래의 상황을 개선할 수 있겠네요. 통계학을 통해 삶의 해상도가 높아졌다는 표현, 꼭 글에 써야겠습니다. 마지막으로, 앞으로 임상통계학자로서 가지고 있는 비전은 어떤 것이 있으신지 여쭤보고 싶어요.
> 네, 무엇보다 저는 지금 제가 하고 있는 일을 통해서, 의료 분야에 기여하고 있다는 보람이 아주 큽니다. 공부할 때는 힘들었는데, 미국 FDA 대응을 하면서 통계뿐 아니라 영어를 활용할 일이 많은 것에도 감사하고 있어요. 의료AI 분야에서 일하면서, 현재 회사의 멤버로서 암의 조기진단에 기여할 수 있을 것으로 봅니다. 그래서, 앞으로가 많이 기대됩니다!
원래 6월에 연재하기로 계획했던 이 글은 작가의 코로나 감염으로 인해 7월로 연기되었습니다. 요즘 코로나 하루 확진자가 3만 명이 넘었다는 뉴스가 보도되기도 했는데요, 독자분들도 바로 지금 ‘코로나에 걸릴 확률을 낮추는' 행동을 하셔서 건강하시길 기원합니다.:)