COVID-19, 우리는 얼마나 심각한 상황에 처했나?
신종 코로나 바이러스 (코로나바이러스 감염증-19)로 온 세상이 들썩이고 있다. 공중파, 뉴스, 신문, 공공장소에서는 끊임없이 코로나 바이러스에 대해 이야기한다. 특히 지난 16일 이후, 확진자수가 무서운 증가속도를 보이며 국내 감염 상황은 완전히 다른 국면으로 접어들었다. 심각한 상황이다. 방역당국은 신천지 대구교회 예배에서 발생한 대규모 접촉과 노출을 원인으로 지목하고 있다.
시민들은 걱정이 크다. 경제, 사회 모든 면에서 다양한 어려움을 겪고 있다. 하지만 바이러스가 눈에 보이지 않는 것처럼, 지금 우리가 처한 상황을 시각적으로 인지하는 것은 쉽지 않은 일이다.
우리는 정말 어떤 상황에 놓여있는 걸까?
지금까지 발생한 사람들은 어떤 사람들이며, 어디에서 왔고, 몇 살일까?
왜 감염되었을까?
앞으로는 어떻게 될까?
이런 질문들에 대한 답을 찾던 도중에 방금 Kaggle에 올라온 질병관리본부의 데이터를 입수했다. 글을 쓰는 지금이 2월 26일 (수) 22:30이고 약 7시간에 업로드가 되었으니, 오늘 오후 5시 30분 정도에 올라온 것이다. CSV 파일을 다운로드하여 파이썬을 활용해 분석을 시도했다. 하지만 막상 데이터량이 많지 않아서 엑셀로 다시 불러왔다. 질병관리본부에서 제공한 데이터에는 총 14개의 칼럼이 있었다.
환자 번호, 환자 생년월일, 국적, 감염지역, 그룹, 감염경로, 감염 오더, 감염된 환자, 접촉 자수, 확진 일자, 퇴원 일자, 사망일자, 상태.
*이 중 감염 오더는 infectiom_order로 되어 있고 별도의 설명이 없었다. 1부터 5까지의 값을 가진 것으로 보아, 질병분류코드의 일종인 것 같다.
국적은 한국인이 가장 많았다. 총 1,146명의 환자 중 99%가 한국인이다. 감염자 거주지는 89%가 아직 밝혀지지 않은 상태다. 아래에는 확진된 지역이 나오는데, 이는 병원의 주소지를 기준으로 집계하니 확진자수와 동시에 집계가 가능하다. 반면 확진자의 실제 거주지를 파악하는 데에는 시간이 걸리는 모양이다.
"그룹"이라는 칼럼이 독특했다. 대부분의 사람들 (97%)는 해당 없음. 하지만 신천지와, 온천교회, 순례는 별도의 그룹이 있다. 참고로 pilgrimage는 순례다. 천주교 안동교구 산하 의성 안계 성당은 지난 8일부터 16일까지 이스라엘 성지순례를 다녀왔다. 또 온천교회는 신천지가 아닌 대한예수교 장로회 소속 교회다. 이로써 공교롭게도 특별히 관리받고 있는 그룹은 천주교, 개신교, 사이비 종교를 아우르는 기독교 그룹이 되었다.
감염경로의 대부분은 파악되지 않고 있다. 전체의 93%. 그러니까 1,146명 중 1070명이 어디서 왜 감염되었는지 모른다. 우리가 알고 있는 나머지 7% 중 가장 큰 감염경로는 환자와의 접촉 (42%)이다. 그다음으로 대구 방문 (30%), 우한 방문 (11%)이 뒤를 잇는다. 이스라엘 성지순례도 8%로 결코 적은 수치가 아니다.
감염지역 역시 데이터가 불충분하다. 10% 정도만 파악이 되는데, 그중에서는 서울이 가장 많다. 그다음을 경상북도가 바짝 뒤쫓고 있고, 밑에는 대구가 따라온다. 나머지 지역은 확진자가 10명 미만으로 적다.
*여기서 재밌는 점은 capital city와 capital area가 둘 다 서울을 의미한다는 점이다. 일종의 표기 오류인데, 사실 어디서나 이런 데이터의 오류를 발견할 수 있다. 국가에서 발표하는 데이터도 예외는 아니다.
환자수는 가파르게 상승하고 있다. 1월 20일을 시작으로 24일 +1명, 26일 +1명, 27일 + 3명,... , 최대 5명 이하로 일순증 하던 확진자수는 2월 18일 큰 변화를 맞이한다. 무려 9명이 증가한 것이다. 이어 19일 +26명, 20일 +39명, 21+100명.... 26일 오늘은 169명의 추가 확진자가 생겼다. 참고로 전체 확진자 수 현황은 네이버에서 손쉽게 확인할 수 있다.
네이버 메인 화면의 코로나 바이러스 현황
확진환자가 1,261명으로 질병관리본부의 1,146명과 115명 정도 차이가 있는 것을 알 수 있다.
마지막으로 알아볼 것은 환자의 나이다. 역시 데이터가 불충분하다, 전체 확진자수의 7%, 85명만 환자의 나이를 알고 있다. 그중 가장 많은 연령대는 50대 (25%)이고, 30대와 20대, 60대가 비슷한 수준을 보이고 있다. 10대와 80대는 1%로 낮은 편인 것이 다행이라면 다행이다.
이상으로 질병관리본부에서 제공한 데이터를 기반으로 신종 코로나 바이러스의 현상태에 대해 알아보았다. 직접 데이터를 분석하며 의미를 생각하다 보니 잘 몰랐던 사실들에 대해 많이 알게 되었다. 이번 사태는 우리에게 시사하는 바가 크다.
위기 대응에 대한 국가 시스템이 잘 되어 있더라도, 대부분의 사람들이 뛰어난 시민의식으로 감염을 예방한다 하더라도 사고가 나지 않는 것은 아니다. 몇몇 사람의 실수에 의해 우리나라는 계산이 어려울 정도의 경제적 손실과 더불어, 세계 사람들의 눈총을 받고 있다. 분명 엄청난 국가적 재난이지만, 이럴 때일수록 힘을 내자. 주변을 너무 욕하지 말자. 물론 신천지가 밉고, 감염이나 위생에 대한 개념이 없는 일부 사람들이 밉지만.... 정신을 차리고, 더 나은 사회를 만들 수 있을지 고민한다면 다음에는 조금 더 현명하게 대처할 수 있으리라.