의도치 않은 2021년도 노벨 경제학상 수상자 소개글 1
여름이 되어 덥고 햇볕이 뜨겁게 내리쬐는 날씨가 계속되면 아이스크림 소비가 늘어난다. 이런 날씨에서는 화상 환자도 증가한다. 즉, 더운 날씨는 아이스크림 소비와 화상 환자의 수를 모두 늘어나게 하는 원인으로 작용한다. 더운 날씨라는 공통의 원인을 제외하고 아이스크림 판매량과 화상 환자의 수만 놓고 보면 이 둘은 함께 증가하는 모습을 보이지만 상식적으로 이 둘 간에 직접적인 인과관계가 있다고 보기는 힘들다. 아이스크림 판매량이 늘어남에 따라 화상 환자의 수도 늘어난다거나, 반대로 화상 환자가 많아짐에 따라 아이스크림 소비가 증가한다는 말을 들으면 고개를 갸우뚱하게 된다. 이러한 경우 우리는 아이스크림 소비와 화상 환자의 수 간에 (인과관계가 아닌) 상관관계가 있다고 말한다.
유발 하라리는 『사피엔스』에서 인간은 언어를 이용하여 실제로는 존재하지 않는 것에 대해 이야기할 수 있게 되면서 고도의 문명을 발전시킬 수 있었다는 이론을 제시한다. 그만큼 인간의 본성이나 마찬가지인 이야기를 할 때 빠질 수 없는 요소 중 하나가 바로 한 사건이 원인이 되어 다른 사건이 발생하게 되는 인과관계다. 우리가 신기하거나 놀라운 뉴스를 듣게 되면 자연스럽게 '왜?'라는 질문을 던지게 되고, 학문에 대한 탐구도 보통 어떤 현상에 대한 원인을 궁금해하는 것에서부터 시작하는 경우가 많다는 점에 비추어 볼 때 모든 현상에 대해 인과관계를 밝히고 싶어 하는 욕구는 사실상 인간의 유전자에 각인되어 있다고 말할 수도 있다.
그러나 두 현상 사이에서 인과관계를 명확하게 밝혀내는 것은 생각보다 어렵다. 첫 단락에서는 일부러 인과관계가 성립된다고 보기 힘든 두 현상을 놓고 설명했기 때문에 상관관계와 인과관계의 구분이 쉬워 보이는 것일 뿐이다. 현실에서는 인과관계가 상관관계와 쉽게 구분되지 않는 경우가 대부분이다. 예를 들어, 백신을 맞은 후 심각한 부작용이 발생하거나 사망에 이르는 경우 과연 백신 접종이 부작용 발생 및 사망의 원인이 된 것인지, 아니면 백신 접종과 부작용 발생 또는 사망이 인과관계없이 단순히 비슷한 시기에 함께 일어난 것인지를 규명하는 데만 해도 상당한 노력이 필요하다.
자연과학에서는 잘 통제된 실험을 이용하여 인과관계를 확립하는 것이 가능하다. 통제 변인 한 가지만을 다르게 하고 다른 실험 조건은 똑같이 한다면 실험 결과의 차이는 결국 통제 변인의 차이 때문이라는 결론을 얻을 수 있다. 위에서 든 백신의 예를 통해 다시 설명을 해 보자면 평균적으로 건강 상태와 생활 습관 등이 비슷한 두 집단 중 한 집단에만 백신을 접종하고 다른 집단에는 전혀 효과가 없는 가짜 백신을 접종했을 때 진짜 백신을 접종한 집단의 감염률이 낮게 나타나는 경우 우리는 백신 접종이 감염률을 낮춘다는 인과관계를 주장할 수 있게 된다. 실제로 새로운 백신을 개발할 때 이와 비슷한 과정을 거쳐 임상 실험을 한다.
그런데 사회과학에서는 인간이 실제 살아가는 사회를 연구하기 때문에 보통 실험이 불가능하다. 노동경제학의 오래된 연구 주제 중 하나인, 대학교 졸업장이 취업 후 임금에 미치는 영향을 생각해 보자. 이론적으로는 고등학생들을 학력 이외에도 임금에 영향을 미칠 수 있는 수학 능력, 가정환경 등이 비슷한 두 집단에 무작위로 배정하여 한 집단은 대학교에 보내고 한 집단은 고등학교만 졸업시킨 후 이들의 평균 임금을 비교하면 된다. 물론 이러한 실험은 윤리적 이유로 실행될 수 없을 것이다. 그렇기 때문에 경제학에서는 제도의 갑작스러운 변경 등으로 생기는 실험에 가까운 상황(quasi-natural experiments)을 분석에 이용하는 경우가 많다. 구체적인 방법은 보통 경제학 학부생들이 3학년이 되어서야 배우는 계량경제학(전공필수가 아닌 학교도 많다.)에서도 꽤나 뒷부분에 슬금슬금 나오기 시작하기 때문에 자세한 내용을 여기에서 풀지는 못할 것 같다.
처음 이 글을 쓰기 시작했을 때는 전혀 예측하지 못했지만, 2021년도 노벨 경제학상은 이러한 인과관계를 확립할 수 있는 계량경제학적 방법론을 발전시킨 경제학자 3명에게 주어지게 되었다. 주로 노동경제학과 관련된 주제를 연구했던 카드(David Card), 앵그리스트(Joshua Angrist), 임벤스(Guido Imbens)는 이중차분법(Difference-in-differences), 도구변수(Instrumental Variable) 등 이제는 응용 미시 분야에서 표준이 된 방법론을 처음으로 경제학 분야에 도입한 선구자들이다. 앵그리스트는 『Mostly Harmless Econometrics』라는 책에서 데이터를 이용하여 경제학적 분석을 수행할 때 인과관계 파악에 도움이 될 수 있는 엄밀한 계량경제학적 방법론을 소개하고 있다.(이 매거진의 이름도 이 책 제목의 영향을 받았다.) 참고로 이 책을 권해 준 교수들은 이 책이 재미있고 쉽다는 식으로 얘기했지만 박사과정 때 졸음을 참아가며 한 달에 걸쳐 읽어본 경험으로는 결코 쉬운 책은 아니었다.
우리는 일상에서 뿐만 아니라 언론, 책 등을 통해서도 매일 많은 이야기를 접하며 살고 있다 보니 수많은 인과관계와 마주치게 된다. 두 변수가 비슷하게 움직이는 그래프만 보여주면서 한 변수가 원인이 되어 다른 변수의 변화를 이끌어 낸다는 식의 이야기를 하는 언론 기사가 그 대표적인 예다. 그렇지만 앞에서 강조했듯이 두 변수가 함께 움직인다고 해서 반드시 인과관계를 의미하지는 않는다. 인과관계와 상관관계는 별개라는 사실을 항상 염두에 두기만 해도, 상당수의 가짜 뉴스를 걸러내고 사실이 아닐 수도 있는 이야기에 덜 휘둘리게 되는 힘을 얻을 수 있을 것이다.
* 표지 사진 출처: https://towardsdatascience.com/correlation-is-not-causation-ae05d03c1f53