리터러시 인사이트 제16화
갑상선암 발병이 크게 늘었습니다. 논문 <한국의 갑상선암 ‘유행’: 검진과 과잉 진단>에 따르면, 발생율이 1993년에서 2011년 사이 15배 늘었습니다. 미디어들은 조기 발견의 중요성을 알렸고, ‘갑상선암 유행’이라는 말이 생겨날 정도였습니다. 국가암지식정보센터의 통계(2023년)를 보면 발생자가 35,440명으로 1위를 기록하고 있으며, 미국에서도 다른 암보다 빠르게 증가하고 있다고 보도합니다.
그런데 주목해야 할 숫자는 따로 있습니다. 사망자 수입니다. 위 연구는 갑상선암 진단율이 15배 치솟았음에도 사망자 수는 10년간 300~400명 사이를 유지했다는 점을 밝혔습니다. 그러니까 급증한 발병률은 실제 위험이 커진 것이 아니라, 검진 기술 발전과 사회적 관심이 만들어낸 일종의 ‘통계적 착시’였던 것입니다. 이 사례는 숫자가 현실을 그대로 반영하기보다, 때로는 특정 방향을 믿게 할 수 있다는 사실을 보여줍니다.
‘통계 리터러시’(statistical literacy)라는 개념이 있습니다. 복잡한 수식을 계산하는 능력이 아닙니다. 학술적으로 정립된 정의는 없지만, 여러 연구는 그 핵심 가치를 ‘일상 여러 곳의 통계적 결과들을 이해하고 비판적으로 평가하는 능력’으로 제시합니다. 나아가 ‘오늘날 민주사회 시민에게 꼭 필요한 역량’으로도 강조되고 있습니다. 요컨대 통계 리터러시란 민주사회 구성원으로서 숫자로 쓰인 말을 정확히 읽고 해석하며, 필요할 때 올바르게 질문할 힘을 의미합니다.
시쳇말로 수포자(수학을 포기한 사람)를 자처하는 사람은 통계를 어렵게 느끼거나 거부하곤 합니다. “나는 문과라서...”라는 말을 하면서 말이죠. 생각해 보면 통계는 일상에 있습니다. 대통령 지지율 기사를 접하고, 스마트폰으로 운동량이 얼마나 늘었는지 확인합니다. 집값 상승세를 검색하고, 강수 확률을 보며 우산을 챙길지 고민하거나, 배달 앱의 별점과 리뷰 개수로 음식 맛을 짐작하기도 합니다. 이처럼 통계는 딱딱하고 어려운 정보가 아니라, 평소에 사용하는 일상의 언어입니다.
통계 리터러시가 필요한 이유는 무엇일까요? 아이러니하게도 숫자는 무엇을 설명하기 위한 자료지만, 우리는 종종 성급히 숫자로 결론을 내리곤 합니다. 여론조사 수치만으로 선거의 승패를 미리 확정 짓기도 하고, 건강검진표의 숫자 한 줄에 조바심부터 내는 식입니다. 여기서 통계 리터러시는 우리를 한 번 더 생각하게 만듭니다. 이 숫자에는 무슨 의미가 있지? 이 뒤에는 무엇이 생략되어 있을까? 라고 스스로 질문하게 하기 때문입니다.
비슷한 개념으로 ‘데이터 리터러시’가 있습니다. 데이터 리터러시가 데이터를 수집, 분석, 활용해 문제를 해결하는 능력이라면, 통계 리터러시는 그 결과로 나타난 숫자와 결론을 읽고, 질문하며, 해석하는 능력입니다. 데이터 리터러시의 중심에 데이터를 ‘어떻게(How) 다룰 것인가?’라는 ‘기술적 분석’이 있다면, 통계 리터러시의 목표는 그 결괏값을 ‘왜(Why) 그렇게 해석해야 하는가?’라는 ‘비판적 해석’에 있습니다. 데이터 리터러시가 데이터를 어떻게 다룰 것인가를 묻는다면, 통계 리터러시는 숫자가 우리에게 무엇을 전달하는지 보게 합니다.
통계라는 단어의 어원을 살펴보면 성격이 명확해집니다. 통계를 뜻하는 statistics라는 단어는 독일어 ‘statistik’에서 왔습니다. 초기 의미는 국가나 공동체의 상태에 관한 자료를 다루는 학문이었습니다. 이 단어는 공공질서를 뜻하는 라틴어 ‘status’와, 국정 운영에 능한 사람을 의미하는 이탈리아어 ‘statista’에서 유래되었습니다.
통계는 태생부터 국정을 관리하고, 공적인 결정을 내리기 위한 언어였습니다. 즉 누군가의 의사결정을 돕는 도구로 출발한 것입니다. 문제는 오늘날 숫자가 결정을 돕는 것을 넘어, 스스로 결론을 내리는 것처럼 보일 때가 있다는 것입니다. 이러한 착각이 굳어지면, 사실이 은폐되거나 왜곡될 위험이 있습니다.
현대 철학자 루트비히 비트겐슈타인(Ludwig Wittgenstein)은 “단어의 의미는 그것이 사용되는 방식에 달려있다”라고 말했습니다. 그 단어를 어떤 상황에, 무슨 목적으로 쓰느냐에 뜻이 결정된다는 것입니다. 숫자도 마찬가지입니다. 얼핏 객관적인 정보로 보이지만, 사실 어떤 문장 속에 놓이느냐에 따라 그 의미는 달라집니다. 선거 뉴스에 퍼센트는 ‘판세’가 되고, 플랫폼의 콘텐츠 조회 수는 곧 ‘가치’로 이어집니다.
여기에 역전, 폭증, 2배 같은 수사(rhetoric)가 결합하면 사람들의 불안을 더 자극하고, 서열을 세우며, 결정을 재촉합니다. 숫자가 설명을 넘어 우리의 생각이나 행동에 개입하는 것이빈다. 이에 통계 리터러시가 필요합니다. 숫자를 읽는 기술이자, 이것이 작동하는 배경과 그 이면의 의미를 읽어내는 역량이기 때문입니다.
갑상선암 사례를 다시 보겠습니다. 숫자의 착시를 잘 보여줍니다. 진단율은 크게 늘었지만, 사망률은 거의 일정했습니다. 즉, ‘질병의 확산’이 아닌 ‘검진과 발견의 확산’이었습니다. 숫자가 틀렸다는 것이 핵심이 아닙니다. 숫자가 가진 의미는 지워지고 곧바로 ‘유행’이라는 판정으로 이어졌다는 것이 문제입니다. 확산에 따른 불안이 검진을 부추기고, 늘어난 진단율이 다시 불안을 키우는 악순환으로 이어졌습니다.
선거 여론조사 수치도 그렇습니다. 확정된 결과가 아닌, 언제든 변할 수 있는 추정치입니다. 하지만 오차범위 내 차이에도 뉴스 제목은 ‘앞선다’와 ‘1위’ 같은 단어를 내보내기도 합니다. 정치인 역시 이를 이용합니다. 유리한 판세라며 대세론을 내세웁니다. 결국 통계가 현실을 비추는 거울이 아니라 현실을 어딘가로 끌고 가는 견인차가 된 것입니다. 민주사회 시민이 가져야 할 역량에 통계 리터러시가 필요하다는 이유도 여기에 있습니다.
물론 통계는 복잡한 세상을 단순화해 보여주는 인류의 중요한 발명품입니다. 하지만, 이 단순함을 잘 읽기 위해서는 통계 리터러시가 필요합니다. 통계 리터러시는 복잡한 숫자를 풀어내는 지식이 아닙니다. 숫자를 마주한 순간, 확정 지을 결론을 잠시 멈춰 질문하는 사유의 힘입니다.
‘이 수치는 전체 중 얼마나 차지할까?’, ‘고정된 진실인가, 아니면 변화하는 추정치일까?’, ‘이 숫자가 지금 상황을 온전히 설명하고 있을까?’
이러한 질문들은 통계가 우리의 생각을 확정 짓기 전, 할 수 있는 짧은 판단 중지입니다. 무조건 믿는 것은 위험합니다. 물론 매번 의심하는 것도 피곤한 일입니다. 최선은 잠시 숨을 고르고 숫자의 이면을 살피는 것입니다. 내일부터 뉴스를 볼 때 잠시 통계를 한 번 더 살펴봅시다. 그리고 위처럼 질문 해보면 어떨까요.
결국 통계 리터러시는 숫자가 나 대신 결론을 내려버리기 전에, 그 숫자를 비판적으로 읽어내는 역량입니다. 그리고 숫자에 휘둘리지 않고 스스로 판단하는 힘은 우리를 민주시민으로 만듭니다.
[참고 자료]
Ahn, H. S., Kim, H. J., & Welch, G. H. (2014). Korea's thyroid-cancer “epidemic”—screening and overdiagnosis. New England Journal of Medicine, 371(19), 1765-1767.
BBC NEWS 코리아 (2025. 11. 16). 갑상선암 환자가 급증하는 이유는 무엇일까. https://www.bbc.com/korean/articles/c0jd01n3xwno
statistics 어원: https://www.etymonline.com/word/statistics
Wittgenstein, L. (2009). Philosophical investigations. 이승종(역). 철학적 탐구. 파주: 아카넷.
국가암지식정보센터: https://www.cancer.go.kr
김슬기, 김태영. (2021). 초? 중등 AI 교육을 위한 데이터 리터러시 정의 및 구성 요소 연구. 정보교육학회논문지, 25권 5호, 691-704.
최경호 (2022). 통계 리터러시에 대한 연구 동향. 아시아태평양융합연구교류논문지, 8권 10호, 335-346.
*이 글은 ‘디지털포용뉴스’에 기고한 칼럼을 수정하였습니다.