이상한 데이터 #2 지도 한 장이 전염병을 멈췄다

by 한경수

1854년 8월 말, 런던 소호 지구.

3일 만에 127명이 죽었다. 콜레라였다. 일주일이 지나자 사망자는 500명을 넘겼다. 거리는 비었다. 살 수 있는 사람은 이미 도망쳤다.

당시 의학계의 설명은 "독기(miasma)"였다. 더러운 공기가 병을 일으킨다. 하수구 냄새, 썩은 쓰레기, 습한 안개. 나쁜 냄새가 나는 곳에서 사람이 죽는다. 합리적으로 들렸고, 거의 모든 의사가 동의했다.

존 스노우는 동의하지 않았다.


스노우는 마취과 의사였다. 전염병 전문가가 아니었다. 하지만 콜레라 환자를 직접 본 경험이 있었다. 콜레라는 위장 질환이다. 구토와 설사로 죽는다. 공기로 전염되는 병이 왜 폐가 아니라 장을 공격하는가?

이게 그의 "어?"였다.

공기가 아니라면 뭔가. 입으로 들어가는 것. 물이 아닐까.

가설은 있었다. 하지만 증거가 없었다. 1854년의 소호 대유행이 증거를 만들 기회였다.


스노우는 걸었다.

죽은 사람들의 집을 하나하나 찾아갔다. 주소를 적었다. 그리고 지도 위에 점을 찍었다. 사망자 한 명이 점 하나.

점들이 모이자 패턴이 보였다.

브로드 스트리트의 우물. 사망자의 대부분이 이 우물 주변에 몰려 있었다. 우물에서 멀어질수록 사망자가 줄었다.

하지만 스노우가 진짜 주목한 건 죽은 사람이 아니었다. 죽지 않은 사람이었다.


우물 바로 옆에 양조장이 있었다. 노동자가 수십 명이었는데, 콜레라에 걸린 사람은 없었다. 왜? 양조장에는 자체 우물이 있었고, 노동자들은 브로드 스트리트 우물 대신 맥주를 마셨다.

또 하나. 우물에서 한참 떨어진 곳에 사는 여성이 콜레라로 죽었다. 이상했다. 조사해보니, 그 여성은 브로드 스트리트 우물물의 맛을 좋아해서 일부러 길어다 마셨다.

가까이 사는데 안 죽은 사람. 멀리 사는데 죽은 사람. 둘 다 같은 것을 가리켰다. 우물이다.

스노우는 교구 위원회를 설득해서 우물 펌프의 손잡이를 떼어냈다. 유행은 끝나고 있었지만, 이 조치 이후 새로운 사망자는 거의 나오지 않았다.


이 이야기에서 가장 놀라운 건 우물이 원인이었다는 것이 아니다.

스노우에게는 현미경이 없었다. 세균을 본 적이 없었다. 물속에 뭐가 있는지 몰랐다. 코흐가 콜레라균을 분리한 건 30년 뒤의 일이다.

원인을 모르면서 원인의 위치를 찾았다.

어떻게? 데이터로.

죽은 사람의 주소. 죽지 않은 사람의 이유. 멀리서 죽은 사람의 습관. 이 세 종류의 데이터가 보이지 않는 원인의 윤곽을 그려냈다.


여기서 제멜바이스와 비교해보자.

제멜바이스는 두 병동의 사망률을 봤다. 10%와 4%. 숫자 두 개의 차이에서 출발했다.

스노우는 사망자 하나하나의 위치를 지도에 찍었다. 점의 분포에서 출발했다.

방법은 달랐지만, 출발점은 같았다. "이상한데?"

제멜바이스: "왜 이 병동만 높지?" 스노우: "왜 이 우물 주변에만 몰려 있지?"

둘 다 같은 데이터를 볼 수 있는 사람은 많았다. 병원 기록은 공개되어 있었고, 사망자 명단은 교구 기록에 있었다. 하지만 숫자에서 질문을 뽑아낸 건 이 두 사람뿐이었다.


한 가지 더.

스노우의 지도는 오늘날 데이터 시각화의 원형으로 꼽힌다. 하지만 스노우는 시각화 기법을 공부한 적이 없다. 그에게 지도는 예쁜 그래프가 아니었다. 사람들이 어디서 죽었는지를 한눈에 보기 위한 도구였을 뿐이다.

도구는 질문 뒤에 왔다. "왜 여기서 죽는가?"가 먼저 있었고, 그 질문에 답하려고 지도를 그린 것이다.

오늘날 우리는 순서가 뒤집혀 있다. 시각화 도구가 먼저 있고, "뭘 그릴까?"를 나중에 고민한다. 대시보드는 화려한데, 그 대시보드가 어떤 질문에 답하는 것인지 모른 채 만드는 경우가 많다.

스노우의 지도는 투박했다. 점과 선뿐이었다. 하지만 질문이 있었다. 그래서 전염병을 멈췄다.


다음: #3 2천 년 된 책에 답이 있었다

매거진의 이전글이상한 데이터 #3 2천 년 된 책에 답이 있었다