유럽에는 오래된 속설이 있다. 황새가 아기를 물어다 준다는 것. 그런데 이것을 뒷받침하는 통계가 실제로 존재한다. 네덜란드의 여러 지역에서 황새 둥지 수와 신생아 수 사이에 양의 상관관계가 관찰되었다.
황새가 많은 지역에서 아기가 많이 태어난다. 데이터는 거짓말을 하지 않는다.
물론 황새가 아기를 데려오는 것은 아니다. 농촌 지역은 굴뚝과 헛간이 많아 황새가 둥지를 틀기 좋고, 동시에 농촌 가정의 출산율이 도시보다 높았다. 도시화라는 제3의 변수가 둘 다를 설명한다. 황새와 아기는 서로 아무 관계도 없다.
이것이 "상관은 인과가 아니다"의 가장 오래된 사례 중 하나다. 누구나 아는 원칙이다. 그런데 이 원칙을 안다는 것과 지키는 것 사이에는 놀라운 거리가 있다.
아이스크림 판매량과 익사 사고 수는 강한 양의 상관관계를 보인다. 아이스크림이 많이 팔리는 달에 익사 사고도 많다. 상관계수를 구하면 인상적인 숫자가 나온다.
그래서 아이스크림을 규제하면 익사 사고가 줄어들까? 물론 아니다. 여름이라는 제3변수가 둘 다를 만든다. 더우니까 아이스크림을 사고, 더우니까 물에 들어간다.
이건 쉽다. 누구나 웃으면서 제3변수를 찾아낸다. 문제는 제3변수가 안 보일 때다.
1편에서 다룬 손가락 길이와 자녀 성비 연구를 다시 보자. 연구자들은 상관관계를 발견하고, "여성이 자녀 성별 결정에 남성보다 큰 영향을 미친다"고 해석했다. 상관에서 인과의 방향까지 제시한 것이다.
그러나 가능한 구조는 여러 가지다.
손가락 길이가 자녀 성비에 영향을 미친다? 메커니즘이 없다. 자녀 성비가 손가락 길이에 영향을 미친다? 시간 순서가 맞지 않는다. 태아기 호르몬 환경이라는 제3변수가 손가락 길이에도, 나중의 생식 환경에도 영향을 미친다? 가능하지만, 경로가 너무 길어서 효과가 미미할 것이다. 아니면 그냥 우연이다.
네 가지 가능성 중 연구자는 하나만 선택했다. 가장 흥미로운 것을. 그리고 그것이 기사 제목이 되었다. "검지·약지 길이 차이 클수록 딸 출산 확률 높아."
A와 B가 상관관계에 있을 때, 가능한 구조는 최소 네 가지다. A가 B를 일으킨다. B가 A를 일으킨다. C가 A와 B를 모두 일으킨다. 우연의 일치다. 데이터만으로는 이 넷을 구별할 수 없다.
우울증과 소셜미디어 사용 시간의 상관관계가 반복적으로 보고된다. 소셜미디어가 우울증을 유발하는가? 우울한 사람이 소셜미디어에 더 오래 머무는가? 외로움이라는 제3변수가 둘 다를 만드는가? 모른다. 그런데 뉴스 제목은 늘 하나의 방향만 선택한다. "SNS 많이 하면 우울해진다."
교육 연구에서도 마찬가지다. "독서량이 많은 학생이 성적이 높다." 독서가 성적을 올리는가? 성적이 높은 학생이 원래 독서를 좋아하는가? 가정 환경이 독서와 학업 모두에 영향을 미치는가? 상관관계 하나에 인과를 부여하는 순간, 정책이 만들어진다. "독서 시간을 늘리자." 효과가 없으면 "더 늘리자."
가장 기묘한 사례가 있다. 미국 워싱턴 NFL 팀이 대통령 선거 직전 홈경기에서 이기면 현직 대통령 소속 정당이 당선되고, 지면 상대 정당이 당선된다는 것이다. 1940년부터 2000년까지 16회 연속으로 맞았다.
16연속이면 우연일 확률이 극히 낮아 보인다. "국민 정서가 스포츠와 정치 모두에 반영된다"는 그럴듯한 설명도 떠오른다.
하지만 이 "법칙"이 발견된 이후, 2004년, 2012년, 2016년에 틀렸다. 충분히 많은 스포츠 팀과 충분히 많은 선거를 비교하면, 과거에 우연히 일치한 조합은 반드시 존재한다. 1편의 다중비교와 같은 구조다.
니콜라스 케이지-익사 사고는 누구나 웃어넘기는데, NFL-대선 상관은 그럴듯하게 느껴진다. 그럴듯한 설명이 떠오르는 순간, 우연의 일치가 발견으로 승격된다. 설명 가능성이 높을수록 경계해야 한다. 인간은 아무 데서나 이야기를 만들어내는 동물이니까.
상관관계에서 인과를 추론하는 정당한 방법이 있기는 하다. 쉽지 않을 뿐이다.
무작위 배정 실험이 가장 강력하다. 사람들을 무작위로 두 집단에 나누고, 한쪽에만 처치를 가하고, 결과를 비교한다. 무작위 배정이 제3변수를 통제한다. 신약의 효과를 검증하는 임상시험이 이 구조다.
실험이 불가능한 경우에는 시간 순서를 확인하고, 용량-반응 관계를 살피고, 메커니즘이 존재하는지를 따진다. 그리고 독립적인 연구에서 반복 재현되는지를 본다. 이 모든 조건을 충족해야 비로소 "인과일 가능성이 높다"고 조심스럽게 말할 수 있다.
"상관관계가 있다"에서 "원인이다"까지의 거리는, 대부분의 뉴스 기사가 한 문장으로 건너뛰는 것보다 훨씬 멀다.
상관인가, 인과인가.
두 변수가 함께 움직일 때, "왜?"를 묻기 전에 "정말 하나가 다른 하나를 만드는가?"를 먼저 물어야 한다. 인과의 네 구조 — A→B, B→A, C→A와 B, 우연 — 중 어느 것인지를 데이터만으로 확정할 수 없다는 사실을 받아들이는 것. 그것이 상관과 인과 사이의 거리를 존중하는 태도다.
다음 편에서는 방향의 문제를 더 밀어본다. 같은 데이터에서 나온 두 숫자가 180배 차이 나는 일이 어떻게 가능한지를.