brunch

매거진 코로나19

You can make anything
by writing

C.S.Lewis

by 이승환 Mar 07. 2020

숫자로 보는 코로나19 사태 추이

지난 주말에 이어 코로나19 관련 국가 별 통계를 살펴봤다.


먼저 한국 코로나19 데이터가 Kaggle에 공개되었다는 소식을 듣고 잠깐 들여다봤다. 이 데이터셋은 세 개의 시트로 구성되어 있다 - 확진자(patient), 동선(route), 시계열 통계(time) / Kaggle 링크


나는 확진자 데이터셋을 이용해 네트워크 분석을 해볼 수 있지 않을까 기대했는데, 아쉽게도 내가 보고 싶었던 수준의 데이터는 없었다. 누구로부터 감염되었는지를 의미하는 'infected_by' 컬럼의 값이 결측치가 너무 많았다. 확진자 동선 데이터도 사례 수가 너무 적어서 의미 있는 정보를 뽑아내기 어려울 것 같았다. 시계열 통계는 집계 값이라 코로나 상황판( wuhanvirus.kr)에서 제공하는 수준 이상의 정보를 얻기 어려울 것 같았다.


시계열 데이터라도 좀 더 디테일하게 들여다볼까 하다가, WHO에서 제공하는 데이터셋을 발견해서 분석해봤다 - Kaggle 링크


이 데이터는 하루에 한 번 업데이트되며, 내가 분석한 건 2020년 1월 22일 ~ 3월 5일 기간의 데이터다. 간단한 숫자와 차트 몇 개로 현재 세계 각국의 상황을 정리해본다.



1. 확진자 수, 치사율, 완치율


2020년 3월 5일 현재 전 세계 국가 중 한국은 누적 확진자 수 2위 (6,088명), 치사율 16위 (0.57%), 완치율 26위 (0.67%)다. 아래 표는 왼쪽부터 확진자 수, 치사율, 완치율 상위 20개 국가를 표현한다. 완치율 상위 5개국은 숫자가 의심되어, 즉 이상하고 불길한 느낌이 들어서 빨간색으로 마킹을 해놨다.


국가 별 확진자 수, 치사율, 완치율



지난 주 포스팅에서 한국의 확진자 수가 많고 치사율이 낮은 것은 긍정적인 숫자로 해석할 수 있다 적었고, 그 이유로 타국 대비 압도적 검사 속도, 정보의 투명성, 민주적 시스템이라는 일부 언론(노컷뉴스, 타임)의 해석을 인용했다. 또한 나는 다소 이른 감이 있지만, 상황을 낙관하고 있다고 적었다.



2. 확진자 수 추이


위의 논지를 이어가서 국가 간 비교를 좀 더 자세하게 해 본 결과가 아래의 차트들이다.


왼쪽 차트는 국가 별 일간 확진자 수 추이를 표현한다. 중국이 압도적 1위이고 한국이 2위인 가운데 이탈리아가 가파르게 치솟아 오르고 있다. 그런데 이렇게만 보면 한국의 확진자 수 추이가 증가세인지, 감소세인지, 잘 보이지 않는다.


오른쪽 차트는 증감세를 좀 더 명확히 보기 위한 차트다. 일자 별 누적 확진자 수를 3월 5일 현재 누적 확진자 수로 나눠주면, 누적 확진자 수 비율이 된다. 즉 모두 0에서 1사이 값을 갖는 표준점수가 된다. 이 차트의 기울기가 위로 꺾이면 증가세, 아래로 꺾이면 감소세로 전환을 의미한다.


한국의 증가세가 3월 초에 들어 다소 둔화되는 가운데 일본, 미국, 유럽의 증가세가 가파르게 치솟고 있다. 이제 이 나라들의 지역감염이 본격적으로 시작된 것을 의미할 것이다...






3. 치사율, 완치율 추이로 유추해 본 각국의 태도와 정보 투명성


아래의 차트들은 국가 별 시작 시점을 표준화했다. X축은 최초 확진자가 보고된 날로부터 시작해 +n 일차의 추이를 보여준다. 난 이렇게 비교해서 보는 것이 각국의 사태 대응 태도를 유추할 수 있는 단서가 될 수 있다고 생각했다.


아래 차트는 치사율 추이를 표현한다. 중국(보라색)의 경우, 치사율 추이가 매우 높은 3%로 시작한 뒤, 2% 초반으로 하락 후 다시 점차 상승해 현재 3.7% 수준이다. 반면 유럽, 일본 등의 사례를 보면, 치사율이 최초로 집계된 후 더 급속히 치솟다가 가라앉는 모습을 보인다.


* 치사율 = 당일 누적 사망자 수 / 누적 확진자 수

사실 어찌 보면 유럽과 일본의 사례가 자연스러운 것으로, 사망자 발생 이후 검사 수를 늘리면서 통계가 정상화되는 과정이라고 볼 수 있다. 사망자 발생 전까지는 본격적으로 관심을 가지기 않고 있다가, 정신 차리고 본격적으로 검사와 방역에 임하는 시점이라고 볼 수 있겠다.


이렇게 보면 중국의 통계는 신뢰하기 어려워 보인다. 최초 보고 시점에서 3% 이후 완만한 감소와 증가가 일어나는데, 인위적으로 숫자를 맞춘 것이 아닐지 의심스럽다...


한국의 경우 치사율이 1%  밑에서 시작해 0.5%를 조금 웃도는 수준을 안정적으로 유지한다. 빠른 검사 속도가 확진자 수를 증가시키는 것, 사망자 수를 감소시키는 것의 두 가지 효과로 낮은 치사율 에 기여했을 것이다. 한편 신속한 대응과 투명한 정보 공개는 치사율의 낮은 변동성에 기여했을 것이다.


한편 아래 차트는 완치율을 표현한다. 위의 차트와 마찬가지로 X축을 최초 확진자 발생일 +n일차로 표준화했다. 사실 이 차트에서 상당히 께름칙한 사례가 중국과 베트남이다. 중국은 완만한 우상향을 보이고 있고, 베트남은 급격한 상승으로 100%의 완치율을 달성했다.


* 완치율 = 당일 누적 완치자 수 / 누적 확진자 수



완치율의 분자는 완치자 수, 즉 보건당국이 '완치'라고 판정한 사람 수다. 그런데 이 코로나19 바이러스의 가장 중요한 특징은 감염과 완치 여부를 확인하기가 매우 어렵다는 것이다. 검사 결과 음성이 양성으로 뒤집히는 사례가 여럿 보고되고 있다. 한 뉴스 기사에 따르면 경주에 거주하는 60세 남성은 6회의 검사 중 5회까지 음성 반응 후 6회 차에서 양성 판정을 받았다(연합뉴스 기사 ; "여러 차례 음성 진단받았다 코로나19 확진받는 사례 잇따라" 링크)


현상이 이렇다면, 베트남의 완치율 100%라는 통계는 매우 위태로운 숫자라고 판단된다. 아니나 다를까, 3월 7일 신규 확진자 2명이 확인되었다. 저 베트남 신규 확진자 2명이 이미 지역사회 감염을 일으켰지만 감염자들이 무증상이라 파악이 안 되고 있을 가능성이 높다. 우려스러운 상황이다. 이 바이러스의 스텔스적 특성으로 인해, 완전히 끝났다고 생각해도 끝나지 않을 가능성이 매우 높다...


완만하게 우상향 중인 중국의 완치율도 신뢰하기 어렵다고 판단된다. 이 나라의 가장 큰 문제는 정보를 투명하게 공개하지 않는다는 것이다. 역시 우려스러운 상황이다...


이런 맥락에서 한국이 완치율 26위, 0.67%를 유지하고 있는 것은 긍정적으로 봐줘야 할 것이다. 이 바이러스와의 싸움은 장기전이 될 공산이 크다. 섣부른 완치 판정으로 희망적인 숫자를 뽑아내는건 무책임한 태도에 다름없다.



생각을 마무리하며


나는 지난번 글에 적었던 낙관을 아직 유지하고 싶다. 한국은 잘하고 있다. 숫자가 그렇게 말하고 있다.


어서 평화로운 일상을 되찾고 싶은 심정이지만 일상 이곳저곳에서, 언론에서 들려오는 소식은 때로 너무 자극적이라 안타깝고 심란한 마음이다. 사실 이런 자극적인 얘기들은 정보적 가치는 거의 없으면서 부정적 감정들을 자극해 사람을 무기력하고 우울하고 불안하게 만든다.


이성의 힘을 부여잡고 근거 없는 비관과 부정적 감정들과 맞서 싸워야 할 때라고 생각해 글을 쓰기 시작했고, 이렇게 데이터까지 후벼 파보게 됐다.


이 또한 다 지나갈 것이다. 이왕 글을 쓰기 시작한 이상, 이 무거운 시간을 지나가는 기록을 담담하고 차분하게 서술해 훗날 되돌아보고자 한다.


난 오늘도 나름대로 충실히 살아가고 있다.



**** 아래 링크에서 매일 갱신된 차트를 열람할 수 있습니다 ****

분석을 수행한 노트북 주소 -> https://www.kaggle.com/mashgold/kerneld56366b3eb

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari