brunch

라이킷 6 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by ZinoStudio Nov 05. 2021

자가검사 음성 두 번이면 안심해도 될까요?

자가검사 키트를 대하는 (구) 데이터 과학자의 생각

놀라지 마세요. 음성입니다. ( ͡° ͜ʖ ͡°)

며칠 전, 지인분이 코로나 검사를 받았다. 필자는 얀센 백신 접종자이지만 맞은지 반년이 다 되어가고, 이 분과는 평소 접촉이 잦아 양성 판정을 받게 되신다면 안심하기는 어려운 상황이었다. 그리고 검사 결과는 그 다음 날이나 되야 받을 상황인데, 그 다음 날은 필자에게 중요한 약속이 있어 쉽게 미루기 어려웠다.

그래서, 처음으로 코로나-19 자가검사 키트를 샀다. 2회 분으로. 지인분의 검사 결과를 마냥 기다리며 운에 맞기고 싶지 않았고(기도메타도 고달픈 일이다...), 무엇보다 의도치 않게 '슈퍼전파자'가 되는 일은 피하고 싶었다.

결과는 셀프 검사 두 번 모두 음성. (결과를 기다리는 마음은... 역시 기도메타는 피할 수 없다.) 안심이 되는 한편, 불현듯 이런 생각도 들었다.

그런데, 진짜 비감염이 맞나...?
감염자인데 결과가 음성으로 잘 못 나왔을 수 있는거 아냐?

실제로, 자기검사 키트가 100% 다 정확하'진' 않을 것이다. 다시 말해, 대부분의 검사자에게는 옳은(corrected) 검사 결과를 제공하겠지만, 여전히 비감염-검사자에게 '잘못된 양성' 판정을 줄 수도 있고 더 위험하게는 감염-검사자에게 '잘못된 음성' 판정을 제공할 가능성도 분명히 존재한다는 것이다.

그럼, 이 자가검사 키트를 어떻게 바라봐야 할까. 여러분이 어떠한 이유로 자가검사 키트를 사서 검사를 진행했다고 가정해보자. 그리고 검사 결과가 음성이 나왔다면, 안심해도 되는걸까? 아니면 여전히 키트의 '오진' 가능성 때문에 의심을 해야하는 걸까? 오진이 의심된다면, 오진이었을 확률은 얼마나 되는 것일까?

알 수 없을 때 불안하다. 그래서 이 글에서는, 자가검사 키트의 정확도에 대해 약-간의 통계학적인 관점에서 어떻게 바라볼 수 있는지 다뤄보려한다. 더 구체적으로는, 자가검사 키트의 정확도는 어떻게 나타내고, 이 수치들을 어떻게 해석 할 수 있는가에 대한 내용이라 하겠다. 이제 시작된 단계적 일상회복 국면에서 역사상 한 번도 경험해보지 못했다는 시기를 겪는 우리 모두가, 막연한 불안감을 한 겹 벗겨낼 수 있기를 바라는 마음이다.

조금 길어질 설명에 앞서 결론부터 먼저 소개하면,

H사 키트 민감도*: 92.9%, 특이도: 99.0%
*민감도: 감염-검사자 중에서 양성이 나올 확률
→ 즉, 감염자 100명이 검사를 진행했을 때, 약 92명은 '양성', 8명은 '음성' 판정 가능성 존재
(참고 기사)

따라서, 두 번의 검사** 결과 모두 '음성' 인 경우 '감염자이면서 두 번 모두 음성이 나올' 확률은
= (7.1% x 7.1% ≒ )약 0.5%
→ 감염-검사자 1,000명 가운데 5명 정도 나올 수 있는 경우의 수
**두 번의 검사가 독립 시행이었다는 가정하에,

검사 키트의 정확도는... '정확도'를 보지 않는다.

'검사 키트가 얼마나 정확한가?'는 '전체 검사 중에서 얼마나 정확하게 찾아냈는가'이다. 이는 '정확도' (Accuracy)라는 이름으로 아래와 같이 정의 된다.

그런데, 왜 '정확도'를 쓰지 않는걸까? (실제로 검사 키트의 성능을 설명하는 자료를 찾아보아도(링크), '정확도'는 쓰이지 않는다는 것을 알 수 있다.) 이는 정확도 하나 만으로는 '검사 키트의 성능'을 제대로 평가하기 어렵기 때문이다. 극단적인 예로, 전체 1만 명의 검사자 중 감염자는 10명 (전체 0.1%) 비감염자는 9990명(전체 99.9%)이 있는 경우를 생각해보자. 이때, 검사키트가 이유 상관없이 모든 검사자에게 '음성' 판정을 제공했다고 하면 이 1만명에 대한 검사 정확도는 99.9%가 된다. 실제로는 10명의 감염자를 단 한 명도 찾아내지 못한 쓸 수 없는 검사 키트이지만, 정확도만 보면 매우 좋은 검사 키트로 둔갑할 수도 있다.

정확도는 감염/비감염자와 상관없이 모든 옳은 분류를 고려한다.

그런 이유로, 이런 경우에는 '정확도'를 대신해 '민감도'(Sensitivity)와 '특이도'(Specificity)라는 지표를 사용한다. 민감도는 '감염-검사자 중 얼마나 '양성' 판정을 내렸는지', 특이도는 '비감염-검사자 중 얼마나 '음성' 판정을 내렸는지'를 나타낸다. 이 두 지표를 위 예시에 적용하면 특이도는 100%이지만, 민감도는 0%로 '실제 감염자는 한 명도 찾아내지 못했다'는 판단을 할 수 있게 된다.

이제, 이 기준으로 현재 시판중인 코로나-19 자가검사 키트들의 성능을 파악해보자.

출처: http://medigatenews.com/news/3116058791

위 표를 보면, SD바이오센서 사의 검사 키트는 감염-검사자 100명 중 약 83명을, 그리고 휴마시스 사의 키트는 약 93명에게 올바른 '양성' 판정을 제공하는 것으로 나타난다. (그럼 휴마시스 사의 검사 키트가 '더 좋다'고도 할 수 있는걸까? 참고로, "그렇게 보긴 조금... 곤란하다"는게 필자의 견해다.)

두 번의 '음성' 판정은, '진짜 음성'일 수 있을까?

이제 진짜 궁금한 내용이다. 두 번의 음성 판정을 받은 검사자는, '진짜 비감염자'라고 볼 수 있을까? 혹시 감염자인데 두 번 모두 '오진'이었을 확률은 어떻게 될까? 결국, 안심해도 되는걸까?

먼저, 민감도에서 힌트를 얻어보자. 민감도는 앞서 소개한 것과 같이, ‘감염-검사자 중에서 얼마나 올바르게 (혹은, 민감하게) 양성 판정을 내리는가’이다. 이는 확률의 형태를 빌려 표현하자면 조건부확률에 해당하는데, 간단히 말해 ‘검사자가 감염자일 경우’라는 제한적인 조건 아래 ‘양성 판정을 내릴 확률’이라고 보면 된다.

이 민감도를 뒤집어보면, '검사자가 감염자인 경우'에도 불구하고 '잘못된 음성 판정을 내릴 확률', 즉 '놓칠 확률'*Miss rate도 구할 수 있다. 감염-검사자(100%)가 받을 수 있는 검사의 결과는 단 두 건(: 양성 또는 음성)이기 때문에, 100% 에서 양성 판정을 받을 확률인 민감도를 빼면 손 쉽게 '놓칠 확률'이 나온다.

* (또는 '거짓 음성 확률'FNR. False Negative Rate이라고도 한다)

필자가 사용했던 휴마시스 사 키트는 민감도가 92.9%로, 이는 '감염자가 검사를 받았을 때, 제대로 찾아 낼 확률'이라면, 놓칠 확률은 (100% - 92.9% =) 7.1% 가 된다. 수치만 가지고 보면, 필자가 감염자라고 해도 '음성' 판정을 받을 경우의 수가 여전히 100번 중 7번은 나올 수 있다는 뜻이다. SD바이오센서 사의 키트는 심지어 17.5%로 과장 좀 "많이" 보태면 거의 18%는 놓쳤다는 것으로 보인다. 이런데 정말 안심할 수 있을까?

(여기까지만 읽고 나가시면 곤란하다. 불신과 불안을 조성하려고 쓴 글이 절대 아니니 조금만 더 들어봐주시면 좋겠다. (⊙_⊙; 허겁지겁... )

두 번의 음성 판정에도 불구하고 감염자일 경우의 수는... 1,000번 중 5번

0.0050. 즉, 0.5%. 5건 있을까-말까 한 경우다. 1,000건 중에서. "~~1,000건 중에 5건은 '무조건' 있다"~~가 아님에 유의하자. 그런데, 확률이 어떻게 이렇게 훅- 떨어진걸까?

계산은 이렇게 된다. 검사 한 건에서 감염자를 놓칠 확률은 7.1% (=0.071) 였다. 필자는 동일한 검사를 독립적으로 두 번 수행했고, 두 결과가 모두 '음성'이었다. 따라서 필자가 만약 감염자임에도 불구하고 별도의 두 검사에서 모두 '놓칠 확률'은, 첫 번째 검사에서 놓치고 그리고 두 번째 검사에서도 또 놓친 경우로 7.1% x 7.1% (: 0.071 x 0.071 = 0.005041), 약 0.5% 뿐이 되지 않는다.**

** (검사 외 어떤 변수도 영향을 미치지 않는다는 가정 하에, 예를 들면 주변 환경 등.)

0.5%로는 안심하기 어려운가? 그럼 확률을 조금 더 들여다 보자. 이 0.5%는 '감염-검사자가 2번의 독립적인 검사를 진행했을 때 나올 수 있는 모든 경우의 수 가운데 [음성, 음성]을 받을 확률'이 0.5% 라는 뜻이다. 검사를 두 번 진행할 경우 나올 수 있는 모든 경우의 수는 총 네 가지(: [양성, 양성], [양성, 음성], [음성, 양성], [음성, 음성]) 이다. 그리고 각 경우의 수에 대한 확률은 아래 그림과 같다.

0.5%의 반대는 99.5%. 즉, 감염-검사자가 두 번의 독립된 검사 중 '최소 한 번은 양성 판정을 받을 확률'은 약 99.5% 이다. 즉, 감염-검사자가 검사를 두 번 진행하면, 열이면 열, 백이면 백, 천이면 구백아흔다섯(995)은, '양성' 판정을 피할 수 없다.

수치는 객관적이다. 판단은 사람의 몫이다.

이젠, 안심이 될 수 있을까? 필자는 우선 그러기로 했다. ‘음성’ 판정 두 건이 여전히 '100% 비감염자'를 보장하진 않지만, 중요한 일정을 앞두고 만에 하나 모를 가능성 때문에 지인분의 결과만 넋놓고 기다려야 하는 불안함을 앉고 가는 것 보단 훨씬 나았다. (관계가, [확진자 → 밀접접촉자(검사 중) → 지인(검사 중) → 필자]로 멀기도 했다... 그리고 자가검사 후 지인분도 음성 판정을 받았다.)

하지만, 여전히 안심하는 것과 감염여부는 별개의 문제다. 검사 결과를 기다리던 지인이 PCR 검사에서 양성 판정을 받았다면, 자기검사 키트 결과와 상관없이 별도로 PCR검사를 받으러 가야한다. 자가검사 키트는 단순히 확률로 규정할 수 없을 만큼 오차가 클 수 있다. 먼저 검사자가 전문가가 아니며, 주변 환경도 제각각이다. 이런 여러 외생변수가 발현될 가능성이 큰 검사는 민감도, 특이도와 같은 지표도 절대적이지 못하다.

식약처는 "자가검사키트를 코로나-19 감염진단용으로 사용해서는 안된다"고 주의사항을 당부했다.

이어 "코로나-19 감염 의심 증상이 있거나 역학적 연관성이 있는 경우에는 자가검사 결과와 관계없이 즉시 선별진료소 등을 방문해 반드시 유전자 검사(PCR)를 최우선으로 받아야 한다"고 부연했다.

이제 단계적 일상회복이 시작됐다. 한 번도 겪어보지 못한 시기를 살고 있다고 이야기 한다. 거리두기, 개인방역, 백신 접종 등 새로운 대응에도 코로나-19 바이러스는 아직도 예측이 쉽지 않다. 그럼에도 '관리가능한 수준'으로 코로나-19와 일상을 함께하려는 앞으로는, 신규 확진자가 더늘어날 수 있다고 어렵지 않게 상상할 수 있다. 이럴 때일 수록 우리 한 명 한 명이, 막연한 불안감에 흔들리지 않는 지혜와 의지가 필요한 때가 아닌가 생각한다.

* 참조

1. 코로나19 자가검사키트 민감도 82~93% 불과, "보조수단으로만 사용", 메디게이트 뉴스, 2021.07.28 (http://medigatenews.com/news/3116058791)

2. Sensitivity and specificity, Wikipedia (https://en.wikipedia.org/wiki/Sensitivity_and_specificity)

keyword

ZinoStudio 소속 직업 연구자

사람을 지향하는 데이터 과학자를 꿈꿉니다. 경계를 넘어 문제를 해결하는 연대의 힘을 믿습니다.

구독자 6

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari