내가 인구학 공부를 하면서 마주한 첫 번째 난관
주의: 이 글은 연령 기간 코호트 (age-period-cohort) 효과의 통계학적 분석이나 시각화를 위한 구체적인 방법론이나 도구를 다루고 있지는 않습니다. 전문적인 내용이 아니라, 인구학적 배경 지식이 적어도 이해할 수 있는 가벼운 내용 전달이 목적입니다.
나는 12월 생이다. 그래서 태어난 지 한 달이 되지 않아 두 살이 되었다. 생각해 보면 어딘가 이상하다. 어떤 두 살은 태어난 지 한 달도 되지 않았는데, 어떤 두 살은 이미 돌잔치를 앞두고 있으니 말이다 (2월에 태어났지만 '빠른'을 적용하지 않고 나와 같이 학교를 다닌 내 친구가 아마 그랬을 것이다). 중고등학교 시절 한국 사람들이 흔히 나이를 세는 방식과 법에서 정하는 '만 나이'가 다른 개념임을 배울 때에도, 나는 그냥 두 가지가 다르다고 생각했지, 어떤 차이가 있는지 곰곰이 생각해보지는 않았다. 그런 내가 생일을 기준으로 나이를 따지는 방법을 본격적으로 익히게 된 것은 아무래도 교환학생 시절, 세계 각국에서 온 사람들에게 내 나이를 설명해야 할 때였다. 그중 일부는 한국에서 나이를 세는 독특한 방법이 있다는 것을 알고 나에게 이 개념을 묻기도 했다. 그리고 내가 유학 생활을 하면서 국제 표준 나이 개념에 점점 익숙해져 한국 세는 나이 개념이 점점 희미해지는 동안, 한국에서도 나이의 기준이 바뀌었다.
한국식 세는 나이에 익숙한 사람들에게는, 국제 표준을 따라가는 나이 계산법이 불편하게 느껴질 수도 있을 것 같다. 익숙하지 않음에서 오는 거부감도 있을 것이다. 반면 생일에 따라 나이를 구분하는 방식에 익숙해지면, 인구학에서 흔히 중요하게 다루는 '연령 기간 코호트 분석 (Age-Period-Cohort Analysis)' 혹은 '연령, 기간, 코호트 효과 (Age-Period-Cohort Effects)'의 논리를 이해하기는 한층 쉬워진다. 표현이 조금 딱딱하지만 전혀 어려운 개념은 아니다. 연령(age)은 생물학적인 나이에 관한 것이고, 기간(period)은 문자 그대로 특정 기간에 관한 것인데, 보통 월, 년과 같은 단위로 계산한다. Calendar year를 사전에서 설명할 때 "One-year period"라고 설명하는 것처럼 매우 직관적인 개념이다. 코호트(cohort)는 마땅한 번역어를 찾기 어려워서 그냥 코호트라고 표현했는데, 인구학에서는 보통 출생 코호트를 의미한다. 영어 사전적 정의의 코호트는 출생 코호트보다는 넓은 개념으로, 특정 성격을 공유하는 사회 집단도 코호트라고 한다. 예컨대 이주민 코호트, 고등학교 졸업자 코호트와 같은 표현이 가능하다. 하지만 연령, 기간, 코호트 효과를 이야기할 때 대부분의 코호트는 연도별 출생 코호트를 의미한다. '1980년 출생자' 등의 구분이 대표적 예시이다.
연령, 기간, 코호트 (효과)를 구분하는 것은 사회과학은 물론 역사학이나 의학 및 보건학에서도 유용하게 쓰일 때가 많다. 반대로, 이를 개념적으로 명확하게 구분하지 못하면 불필요한 혼동이 생길 수 있고, 연구 설계나 결과 해석에 문제가 생길 수도 있다. 연령, 기간, 코호트 효과를 모델링하고, 구분하는 것은 연구자 입장에서는 그다지 간단한 일은 아니고, 이와 관련된 방법론 서적과 논문이 이미 상당히 나와 있다. 이 글에서는 이런 전문적인 내용보다는 직관적인 예시 몇 가지를 소개하고자 한다. 먼저 기간 효과의 예시를 보자.
2020년부터 몇 년 동안 전 세계를 휩쓸었던 Covid-19는 기간 효과를 보여줄 수 있는 대표적인 사례이다. 예컨대 Covid-19에 대응하기 위한 사회적 거리 두기는 연령과 상관없이 사회적 거리 두기가 권장 혹은 강제되는 기간 동안 그 사회 구성원 모두에게 영향을 미쳤다. 물론 연령에 따라 구체적인 사회적 교류의 방식이 다르기 때문에 세세하게 따지면, 그 영향이 연령대 별로 다르다고 볼 수도 있지만, 큰 틀에서 보자면 10대는 사회적 거리 두기의 영향을 받지 않고, 20대는 받았다고 주장하기는 어렵다. 더 극단적인 사례는 한 사회를 휩쓴 천재지변이나 인재 등일 수도 있지만, 좀 더 와닿는 최근 예시로는 Covid-19가 적당할 것 같다.
마찬가지로 연령 효과의 예시도 일상생활에서 충분히 찾을 수 있다. 운전면허, 음주, 흡연 등이 생물학적인 연령 효과와 별도로 사회적 연령 효과를 불러올 수 있는 제도의 대표적인 예시이다. 예컨대 어떤 나라가 정확히 17세가 지난 다음부터 운전면허 취득 및 운전이 가능하다고 가정하자. 16세 11개월인 A라는 사람과 17세 1개월에 접어든 B라는 사람은 평균적으로는 생물학적으로 다른 질병의 위험이나 노화에 노출된 정도가 비슷하겠지만, B가 면허를 바로 취득하고 운전을 시작한다면 갑자기 운전으로 인한 사고 및 사망 위험이 올라갈 수 있다. 공교롭게도 17세부터 음주가 허용된다면 음주 운전으로 인한 사고 및 사망 위험도 같이 올라간다. 만약에 어떤 가상의 유전자가 정확히 45세부터 특정 질병 발병의 위험을 급격하게 높인다면, 이 역시 연령 효과를 만들어내는 요소가 될 수 있다. 이런 효과의 특징은 출생 코호트나 시기에 구애받지 않고 특정 연령에 접어들면 효과가 발생한다는 것이다.
코호트 효과 역시 무시할 수 없다. 현대 사회에서 찾아볼 수 있는 대부분의 코호트 효과는 역시 정책 변화와 관련이 있다. 예컨대 의무 교육 기간이 확대되거나, 입시 제도가 변하는 등의 일로 인해 대학 진학률이나 자퇴율에 변화가 생기는 경우에 관한 연구 등이 이런 코호트 효과를 활용한다 (물론 제도가 도입되는 데 시간이 걸리기 때문에 코호트 효과가 무 자르듯이 확실하게 나타나지 않는 경우가 많다). 학교 중심의 예시를 들다 보면 이를 연령 효과가 혼동할 수도 있지만, 한 학년에는 보통 나이가 다른 두 집단이 포함된다. 대부분의 나라는 N세부터 입학하기보다는, 출생 코호트를 중심으로 (혹은 특정 연도에 N세가 되는 사람을 대상으로) 학년을 구분하기 때문이다. 물론 학교 밖을 벗어나는 코호트 효과도 존재할 수 있다. 사회보장제도와 연금 제도의 개편 등이 코호트 효과를 야기할 수 있고, 건강검진 종목의 축소나 확대 등도 마찬가지이다.
내가 인구학 석사 과정을 공부할 때에는, 한국식 세는 나이에 익숙해서 코호트와 연령을 자꾸 혼동하곤 했다. 한 학년에 서로 다른 두 연령층이 존재한다는 것, 그리고 모두의 생물학적 나이는 다르다는 것을 완전히 이해하고 모델링하는 데 꽤 오랜 시간이 걸렸고, 지금에서야 웃으면서 털어놓는 에피소드가 되었지만, 당시에는 머리를 싸매고 헷갈리지 않기 위해 꽤나 노력해야 했었다. 사실 일상생활에서 이것이 그렇게 중요한 문제는 아닌데, 사회학이나 경제학에서 하나의 출생 코호트에 속한 구성원들의 생물학적 나이는 다 조금씩 다른 부분을 활용한 연구를 하는 경우가 더러 있어서, 이런 연구 디자인을 이해하는 것이 남들보다 좀 더 느린 점은 답답하게 느껴졌다 (예컨대 왜 미국 아이스하키 선수들은 사사분기보다는 일사분기에 태어난 사람들이 더 많은지에 관한 연구 등).
연령, 기간, 코호트를 이렇게 개념적으로 구별하더라도 이를 남에게 설명하는 것은 이해하는 것보다 어려울 수 있다. 그래서 인구학 연구자들은 종종 렉시스 다이어그램 (Lexis diagram)이라는 시각화 도구를 활용해서 연령, 기간, 코호트 문제를 좀 더 보기 쉽게 표현하기도 한다. 이번 글에서는 간단한 링크만 첨부하고, 렉시스 다이어그램에 관해서는 별도의 포스팅에서 다룰 예정이다. 흔히 인구학 교과서에서는 렉시스 다이어그램까지만 다루지만 최근 연구 동향을 보면 이를 확장한 렉시스 서피스 플롯 (Lexis surface plot) 등을 활용하는 경우도 있다. 관련 내용도 추가 포스팅에서 함께 소개할 예정이다.
아마 연령, 기간, 코호트를 구분해서 생각하는 것이 항상 직관적으로 와닿지는 않겠지만, 정책의 효과를 분석하거나, 사회 현상이 미치는 파급력을 분석할 때에도 이런 구분이 꽤 가치가 있을 때가 많다. 정통 인구학자의 길을 걷고 있지 않은 나에게, 그래도 인구학을 공부하면서 얻은 가장 유용한 지식이 무엇인지 물어보면 아마 연령, 기간, 코호트를 구분해서 생각하는 훈련은 반드시 후보로 오를 것 같다.
최근 바닥이 어딘 지 알 수 없는 한국의 합계출산율 (TFR) 통계를 보고 언론 보도가 쏟아지고 있다. 마침 2022년부터 대학원 수준의 인구학 기초 방법론 과목에서 출산 관련 기초 통계 부분을 이주 관련 통계와 함께 맡아서 강의하고 있으니, 흔히 이야기하는 합계출산율을 비롯한 여러 출산 관련 통계에 관한 포스팅도 준비하려고 한다. 다만 인구학을 한국에서 공부하지 않다 보니, 각종 개념을 어떻게 번역하는 것이 가장 적당한지 찾는 일에 시간이 걸려서 게으름을 피운 점이 조금 아쉽다. 관련 논의에 사회적 관심이 아직 뜨거울 때 조금 더 부지런해지기로 다짐하며, 연령, 기간, 코호트의 개념을 간단히 소개하는 글을 마친다.
커버 이미지 출처: Parkinson, Jane, Jon Minton, Janet Bouttell, James Lewsey, Anoop Shah, and Gerry McCartney. ‘Do Age, Period or Cohort Effects Explain Circulatory Disease Mortality Trends, Scotland 1974–2015?’ Heart 106, no. 8 (1 April 2020): 584–89. https://doi.org/10.1136/heartjnl-2019-315029. 의 Figure 1. 본문 내용과는 큰 관련이 없지만, 연령, 기간, 코호트 효과의 시각화와 관련된 자료라서 커버 이미지로 활용했다.