매거진 지식일기

매개효과 분석 방법 최신트렌드

바론과 케니의 매개효과 분석을 이은 최신 매개효과 분석 방법론 소개하기

by 낭만민네이션

0. 들어가기


대학원 과장에서 가장 흥미로웠던 방법론이 매개분석이었다. 매개효과 분석은 독립변수가 어떤 경로를 거쳐 종속변수에 도달하는지를 규명하는 사회과학의 핵심 도구라고 할 수 있다. 전통적으로 연구자들은 변수 간의 직접적인 인과관계를 넘어 그 이면에 숨겨진 메커니즘을 밝히는 데 집중해 왔다. 이러한 흐름 속에서 바론과 케니가 제시한 3단계 회귀분석 모델은 매개분석의 고전적 표준으로 자리 잡았다. 이 모델은 분석 과정이 직관적이며 변수 간의 관계를 단계적으로 검토할 수 있다는 장점이 있다. 하지만 시간이 흐르면서 통계학적 엄밀성에 대한 요구가 높아지자 고전적 방식의 한계가 드러나기 시작했다. 그래서 나는 이 지점에 멈춰 있다. 여전히 과거의 바론과 케니의 매개변수 효과밖에 못하기 때문이다.


바론과 케니의 방법론은 특히 간접효과를 수치적으로 직접 검증하지 못한다는 점은 학계에서 꾸준히 지적된 문제였다. 바론과 케니의 방법론이 나온게 1986년니깐 벌서 40년이나 지났다. 그 때는 새로운 방법론이라서 그나마 괜찮았는데, 지금은 더 명확하고 정밀한 방법들을 필요로 한다. 현대 연구는 단순히 유의성을 확인하는 수준을 넘어 효과의 크기를 정밀하게 측정하는 방향으로 나아가고 있다. 이제는 고전적 방법론을 넘어선 혁신적인 통계 기법들이 연구의 신뢰도를 뒷받침하는 필수 요소가 되었다. AI의 발전과 통계학의 발전은 결국 같이 가고 있는 것이다. 그러니 통계학을 더욱 제대로 하는 수 밖에 없다. 오늘 소개할 방법론들을 실제로 해볼려면 말이다.


과거의 방식은 독립변수가 종속변수에 미치는
총 효과가 반드시 유의해야 한다는 전제 조건을 강조했다.


이러한 전제는 총효과가 유의하지 않지만 매개변수가 작동하는 '은폐된 매개효과'를 발견하지 못하는 결과를 초래했다. 결국 다른 효과들을 잡아내지 못한 것이다. 또한 검증하는 과정에서 사용하는 소벨 테스트는 그럴듯하지만 사실 간접효과의 분포가 정규성을 띈다는 가정을 뒷받침하는 실제 데이터는 이를 충족하지 못하는 경우가 많았다. 종합해보면 바론과 케니의 매개효과 분석과 같은 방법은 통계적 가정의 오류가 매개효과를 과소평가하거나 잘못된 결론을 내릴 위험을 내포하고 있었다. 학계에서는 이러한 수치적 한계를 극복하기 위해 표본의 분포를 재구성하는 '비모수적 방법론'에 주목하기 시작했다. 그 이야기는 '모수'를 최대한 많이 모아야만 혹은 제대로 모아야만 좋은 통계결과가 나온다는 가정을 버린 것이다.


'랜덤 통제 검증'과 같은 방법론이 무작위로 테스트를 한 결과가 더 정확하다는 방법론으로 나온 것을 보면 알 수 있다. 현대적 분석은 모수의 제약에서 벗어나 더 유연하고 강력한 통계적 검정력을 확보하는 데 주력하고 있다. 데이터의 특성에 구애받지 않고 인과관계를 설명할 수 있는 정교한 모델링의 필요성이 어느 때보다 강조되는 시점이다. 이게 정말 가능한가? 그래서 나도 이 글을 쓰고 있다. 정말로 가능하다면 어떻게 해야 할까? 결론적으로 현대 매개효과 분석은 고전적 토대 위에 정밀한 통계 기법이 결합된 형태로 진화하고 있다고 볼 수 있다. 오늘은 부트스트래핑을 시작으로 해서 구조 방정식과 그 외의 방법론들도 한번 돌아보고자 한다. 과연 어떤 방법론들이 기다리고 있을까? 함께 다음 페이지로 넘어가보자.


매개효과분석이란

매개효과 분석은 독립변수가 종속변수에 영향을 미치는 과정에서 제3의 변수인 매개변수가 수행하는 심리적 혹은 구조적 메커니즘을 밝히는 통계적 방법이다. 단순히 두 변수 사이의 관계를 확인하는 것을 넘어, "왜" 그리고 "어떻게" 그러한 결과가 나타나는지에 대한 인과적 통찰을 제공한다. 예를 들어 교육 수준이 소득에 미치는 영향을 연구할 때, '직무 숙련도'라는 매개변수를 통해 교육이 숙련도를 높이고 그 숙련도가 다시 소득을 높이는 경로를 입증하는 식이다. 이러한 분석은 현상의 내면을 들여다보게 함으로써 이론적 모델의 깊이를 더하고 실천적인 개입 지점을 찾는 데 결정적인 역할을 수행한다. 사회과학 연구에서 매개효과는 변수 간의 역동적인 관계를 설명하는 가장 핵심적인 분석 틀로 자리 잡고 있다.

전통적으로 매개효과를 검증하기 위해 가장 널리 사용된 방식은 바론과 케니(Baron & Kenny)의 3단계 회귀분석 모델이다. 이 방법은 독립변수가 매개변수에 미치는 영향, 매개변수가 종속변수에 미치는 영향, 그리고 독립변수가 종속변수에 미치는 영향이 단계별로 유의한지를 검토한다. 마지막 단계에서 매개변수를 투입했을 때 독립변수의 영향력이 사라지면 완전매개, 감소하면 부분매개라고 정의하는 직관적인 기준을 제시한다. 그러나 이 방식은 간접효과의 크기를 직접 계산하지 못하고, 총효과가 반드시 유의해야 한다는 보수적인 전제 조건 때문에 현대 연구에서는 한계가 지적되기도 한다. 그럼에도 불구하고 매개분석의 기본 논리를 세웠다는 점에서 학술적 기초로서 여전히 중요한 가치를 지닌다.

현대 통계학에서는 바론과 케니 방식의 한계를 극복하기 위해 부트스트래핑(Bootstrapping) 기법을 표준으로 사용하고 있다. 부트스트래핑은 수집된 데이터를 수천 번 재표본 추출하여 간접효과의 분포를 직접 생성하고, 이를 통해 95% 신뢰구간을 산출하는 비모수적 방식이다. 이 기법은 간접효과의 분포가 정규분포를 따르지 않더라도 정확한 검증이 가능하며, 표본 크기가 작은 연구에서도 높은 통계적 검정력을 보여준다. 특히 앤드류 헤이즈의 PROCESS macro와 같은 도구가 보급되면서 복잡한 계산 과정이 자동화되어 연구자들의 접근성이 획기적으로 높아졌다. 신뢰구간 내에 '0'이 포함되지 않으면 매개효과가 유의하다고 판단하는 명확한 기준은 연구 결과의 객관성을 뒷받침한다.

최근의 매개효과 분석은 구조방정식 모델링(SEM)이나 조절된 매개효과 등 더 정교한 모델로 확장되는 추세다. 구조방정식을 활용하면 변수 측정 시 발생하는 오차를 통제할 수 있어 더욱 순수한 인과관계의 경로 계수를 얻을 수 있다. 또한 매개효과가 특정 조건이나 집단에 따라 달라지는지를 분석하는 조절된 매개효과는 현상의 복잡성을 맥락 속에서 파악하게 해준다. 이는 단순한 인과관계를 넘어 "언제 매개효과가 극대화되는가"에 대한 답을 제시함으로써 정책이나 전략 수립에 구체적인 근거를 제공한다. 향후 연구는 이러한 고도화된 방법론을 통해 인간 행동과 사회 현상의 다층적인 인과 지도를 더욱 정밀하게 그려나갈 것이다.


https://brunch.co.kr/@minnation/3704


1. 부트스트래핑(Bootstrapping)을 활용한 간접효과 검증


부트스트래핑은 현대 매개분석에서 가장 널리 권장되는 비모수적 재표본 추출 기법이다. 이 방법은 모집단의 분포를 알 수 없을 때 수집된 표본을 반복적으로 추출하여 가상의 분포를 생성한다. 보통 5,000회 이상의 시뮬레이션을 거쳐 간접효과의 표집 분포를 형성하는 과정을 거친다. 이를 통해 간접효과인 times의 유의성을 판단할 수 있는 신뢰구간을 직접적으로 도출한다. 소벨 검정과 달리 정규성 가정을 필요로 하지 않기에 표본의 크기가 작아도 안정적인 결과를 보여준다. 신뢰구간의 하한값과 상한값 사이에 0이 포함되지 않으면 통계적으로 유의미한 매개효과가 있다고 판단한다. 이는 과거의 단계별 유의성 검증보다 훨씬 강력한 통계적 증거를 연구자에게 제공한다. 현재 대부분의 학술지에서는 부트스트래핑 결과를 포함하지 않은 매개분석을 불완전한 것으로 간주하기도 한다.


이 기법의 가장 큰 장점은 데이터가 가진 본연의 변동성을
분석에 그대로 반영할 수 있다는 점이다.

인위적인 가정을 배제하고 실제 관측된 데이터의 분포를 활용하기 때문에 추정의 편향이 적다. 또한 다중매개 모델에서도 각각의 간접 경로에 대한 개별적인 유의성을 명확하게 구분하여 제시해 준다. 연구자는 각 경로의 상대적 중요성을 비교함으로써 이론적 모델의 타당성을 입증할 수 있다. 앤드류 헤이즈 교수가 개발한 PROCESS macro는 이 복잡한 과정을 자동화하여 대중화하는 데 기여했다. 클릭 몇 번으로 정규한 부트스트래핑 결과를 얻을 수 있게 되면서 연구의 질적 수준이 상향 평준화되었다. 단순 매개부터 복잡한 병렬 매개까지 모든 형태의 모델에 유연하게 대응할 수 있는 범용성을 갖추고 있다. 결국 부트스트래핑은 현대 매개분석의 신뢰도를 책임지는 표준적인 검증 절차로 확고히 자리 잡았다.


bootstrap_1.png


부트스트래핑을 적용할 때는 연구자가 설정한 재표본 추출 횟수와 신뢰구간의 종류가 결과에 영향을 미친다. 일반적으로 95% 신뢰구간을 사용하며 편향 수정(Bias-corrected) 방식이 주로 선택된다. 이 방식은 재표본 추출 과정에서 발생할 수 있는 평균의 치우침을 교정하여 더욱 정확한 구간을 산출한다. 분석 결과 보고 시에는 계수값과 함께 반드시 신뢰구간의 수치를 상세히 기술해야 한다. 독자는 이 수치를 통해 매개효과가 우연에 의한 것인지 실제적인 인과관계인지를 판단하게 된다. 이론적으로 도출된 가설이 실제 데이터에서 얼마나 강건하게 지지되는지를 수치로 증명하는 셈이다. 최근 연구들은 단순한 유의성 여부를 넘어 효과의 크기(Effect Size)를 함께 논의하는 추세다. 이는 통계적 유의성이 실질적인 현상의 중요성을 담보하지 못할 수도 있다는 우려를 불식시키기 위함이다.


부트스트래핑의 도입은 매개효과 연구의 패러다임을 '유의성 확인'에서 '효과 추정'으로 완전히 전환했다. 이제 연구자들은 단순히 별표* 하나에 의존하기보다 신뢰구간의 폭과 분포를 살피며 결과를 해석한다. 이는 데이터에 대한 깊이 있는 이해를 가능케 하며 연구의 투명성을 제고하는 효과를 낳았다. 또한 다양한 제3의 변수가 투입된 상황에서도 간접효과를 독립적으로 분리해낼 수 있는 정교함을 선사한다. 학문적 엄밀성을 추구하는 현대 사회과학에서 이 기법은 필수불가결한 도구가 되었다. 향후 인공지능이나 빅데이터를 활용한 연구에서도 부트스트래핑의 논리는 여전히 유효하게 작용할 것이다. 데이터의 불확실성을 통제하면서도 핵심적인 인과 메커니즘을 밝혀내는 이 기법의 가치는 매우 높다. 연구자는 이 도구를 활용하여 자신의 이론적 주장을 더욱 당당하고 논리적으로 펼칠 수 있게 된 것이다.


img.png?credential=yqXZFxpELC7KVnFOS48ylbz2pIh7yKj8&expires=1767193199&allow_ip=&allow_referer=&signature=3qUUXobpznl64h9ywPUob07aSN8%3D


부트스트래핑 분석의 실제 사례 1_직무 스트레스와 이직 의도

직무 스트레스가 이직 의도에 미치는 영향에서 '번아웃(심신 소진)'의 매개효과를 분석하는 상황을 가정해 본다. 연구자는 100명의 직장인을 대상으로 설문조사를 실시하여 스트레스 수준, 번아웃 정도, 이직 의사를 측정했다.

수집된 100명의 데이터를 모집단으로 간주하고, 컴퓨터를 통해 이 안에서 무작위로 100명을 다시 뽑는 과정을 5,000번 반복한다. 이때 한 번 뽑힌 사람이 중복해서 뽑힐 수도 있고 전혀 뽑히지 않을 수도 있는 '복원 추출' 방식을 사용한다. 매번 추출된 가상의 표본 5,000개 각각에서 스트레스가 번아웃을 거쳐 이직으로 가는 간접효과times수치를 계산한다.

이렇게 계산된 5,000개의 간접효과 수치들을 크기순으로 나열하여 하나의 거대한 분포도를 만든다. 이 분포에서 하위 2.5%에 해당하는 값과 상위 97.5%에 해당하는 값을 찾아 95% 신뢰구간을 설정한다.

만약 계산된 신뢰구간이 [0.15, 0.45]와 같이 산출되어 구간 사이에 숫자 '0'이 포함되지 않는다면 매개효과는 유의하다. 결국 부트스트래핑은 단 한 번의 계산이 아니라 수천 번의 시뮬레이션을 통해 매개효과의 실체를 확증하는 과정이다.


부트스트래핑 분석의 실제 사례 2_기업의 사회적 책임과 구매 의

기업의 사회적 책임 활동(CSR)이 브랜드 신뢰를 매개로 구매 의도에 영향을 미치는 메커니즘을 분석한다고 가정한다. 연구자는 소비자 150명을 대상으로 데이터를 수집한 뒤, 이를 바탕으로 부트스트래핑 시뮬레이션을 수행한다.

먼저 컴퓨터는 원래의 데이터셋에서 무작위 복원 추출을 통해 150명 규모의 새로운 가상 표본을 수천 개 생성한다. 각 가상 표본마다 CSR 활동이 브랜드 신뢰를 높이고, 이것이 다시 구매로 이어지는 간접효과 값을 반복해서 산출한다. 이렇게 얻어진 수만 개의 간접효과 값들을 정렬하여 간접효과가 존재할 가능성이 있는 수치적 범위를 확정한다.

95% 신뢰구간을 설정했을 때 그 범위의 하한값과 상한값 사이에 '0'이 존재하지 않는지를 면밀히 확인한다. 만약 신뢰구간이 모두 양수 혹은 음수로 나타나 '0'을 포함하지 않는다면, 브랜드 신뢰의 매개효과는 통계적으로 확실하다고 결론짓는다.

이 방식은 데이터가 정규분포를 따르지 않는 실제 소비자 반응 연구에서 매우 정교한 검증 결과를 보장한다. 시뮬레이션을 통한 이 정밀한 검증 과정은 연구 결과에 대한 학술적 설득력을 획기적으로 높여주는 핵심적인 절차다.


SPSS PROCESS macro

SPSS PROCESS macro는 현대 사회과학 연구에서 매개효과와 조절효과를 검증하기 위해 가장 널리 사용되는 혁신적인 통계 도구다. 앤드류 헤이즈 교수가 개발한 이 도구는 기존 SPSS의 기본 회귀분석 기능만으로는 실행하기 까다로웠던 복잡한 경로 분석을 매우 간편하게 처리해 준다. 연구자는 자신의 가설에 부합하는 모델 번호를 선택하는 것만으로도 복잡한 수식 계산 없이 정교한 분석 결과를 얻을 수 있다. 특히 현대 매개분석의 표준인 부트스트래핑 기능을 기본적으로 내장하고 있어 간접효과의 유의성을 즉각적으로 판별하게 돕는다. 단순 매개부터 여러 개의 매개변수가 얽힌 직렬 매개, 그리고 조절변수가 결합된 모델까지 수십 가지의 템플릿을 제공한다. 이 도구의 보급은 학술 논문의 통계적 엄밀성을 상향 평준화하는 데 결정적인 기여를 했다고 평가받는다. PROCESS macro는 데이터 뒤에 숨겨진 복잡한 인과 지도를 그리는 연구자들에게 없어서는 안 될 필수적인 조력자다.

이 도구의 가장 탁월한 점은 매개효과의 유의성을 판단할 때 부트스트래핑 신뢰구간을 자동으로 산출하여 분석의 정확도를 높인다는 것이다. 과거에는 소벨 검정을 위해 별도의 계산기를 활용하거나 정규성 가정을 충족해야 하는 번거로움이 있었으나 이제는 그럴 필요가 없다. 분석 결과에서 출력되는 LLCI(하한값)와 ULCI(상한값) 사이에 0이 포함되어 있는지만 확인하면 매개효과의 유무를 즉시 알 수 있다. 또한 조절효과 분석 시 변수 간의 상호작용 항을 연구자가 일일이 생성하지 않아도 프로그램이 내부적으로 처리하여 오차를 줄여준다. 존슨-네이만 기법을 통해 조절 효과가 유의하게 나타나는 구체적인 경계점까지 수치로 제시해 주는 정교함을 갖췄다. 결과 보고에 필요한 효과 크기와 표준 오차 등을 체계적으로 정리하여 보여주므로 논문 작성 시간을 획기적으로 단축시킨다. 통계 소프트웨어 활용 능력이 다소 부족한 연구자라도 논리적인 모델 설계 능력만 있다면 고수준의 분석을 수행할 수 있게 된 것이다.

PROCESS macro를 활용한 분석의 핵심은 연구 가설과 일치하는 적절한 모델 번호를 지정하고 각 변수의 역할을 명확히 입력하는 데 있다. 독립변수(X), 종속변수(Y), 매개변수(M), 조절변수(W, V)를 각각의 칸에 배치하고 부트스트래핑 횟수를 보통 5,000회 이상으로 설정한다. 단순 매개 모델인 4번 모델이나 조절된 매개 모델인 7, 14번 모델 등이 실무에서 가장 빈번하게 활용되는 번호들이다. 분석이 완료되면 개별 경로 계수의 유의성($p$-value)을 먼저 확인한 뒤, 최종적으로 간접효과의 신뢰구간을 검토하는 순서로 해석을 진행한다. 특히 매개변수가 여러 개일 경우 각 경로의 개별 간접효과와 총 간접효과를 구분하여 보여주어 이론적 모델을 더욱 세밀하게 검증하게 한다. 이처럼 체계적인 분석 구조는 연구자가 자신의 주장을 뒷받침할 강력한 통계적 근거를 확보하도록 돕는다. 복잡한 통계 절차를 단순화하면서도 결과의 신뢰성은 극대화한 것이 이 도구의 진정한 가치다.

결론적으로 PROCESS macro는 현대 사회과학 연구의 방법론적 수준을 한 단계 격상시킨 강력하고 유연한 분석 프레임워크다. 단순히 통계 수치를 뽑아내는 도구를 넘어 연구자가 현상의 인과 구조를 더욱 깊이 있게 고찰하도록 유도하는 교육적 효과도 지닌다. 하지만 도구의 편리함에 매몰되어 변수 간의 이론적 개연성을 간과한 채 무분별하게 모델을 돌리는 것은 지양해야 할 태도다. 통계적 유의성만큼이나 중요한 것은 해당 매개 경로가 실제 현실에서 어떤 의미를 갖는지에 대한 연구자의 논리적 해석이다. 학계에서는 여전히 이 도구를 활용한 새로운 분석 기법들이 지속적으로 업데이트되고 있으며 관련 커뮤니티도 활발하게 운영되고 있다. 연구자는 이 강력한 무기를 활용하여 데이터 속에 숨겨진 진실을 밝히고 사회적 가치를 창출하는 고품질의 연구를 완성해야 한다. 앞으로도 PROCESS macro는 정밀한 인과 추론을 지향하는 모든 연구자에게 가장 신뢰받는 표준 도구로 남을 것이다.


https://www.spss-tutorials.com/spss-process-macro-tutorial/



2. 구조방정식 모델링(SEM)


구조방정식 모델링은 측정 오차를 통계적으로 통제할 수 있다는 점에서 일반적인 회귀분석 기반 매개분석과 차별화된다. 관측 변수들이 잠재변수를 얼마나 잘 설명하는지 측정 모델을 통해 먼저 검증하는 절차를 거친다. 이는 연구자가 측정하고자 하는 개념이 실제 데이터에 정확히 반영되었는지를 확인하는 필수적인 과정이다. 매개효과 분석 시 독립, 매개, 종속변수를 모두 잠재변수로 설정하여 변수 간의 관계를 보다 순수하게 추정한다. 측정 오차가 제거된 경로 계수는 회귀분석 결과보다 더욱 정확하고 신뢰할 수 있는 수치를 제공한다. 전체 모델의 적합도를 나타내는 지수들을 통해 가설로 설정한 매개 모델의 타당성을 종합적으로 판단한다. 이론적 모형이 현실 세계의 데이터를 얼마나 잘 모사하고 있는지를 입증하는 강력한 도구가 된다. 따라서 학계에서는 변수 간의 복잡한 인과관계를 설명할 때 구조방정식을 표준적인 방법론으로 채택하고 있다.


구조방정식의 가장 큰 강점 중 하나는 다중 매개경로를
동시에 분석하고 비교할 수 있다는 유연성에 있다.


여러 개의 매개변수가 병렬적으로 나열되거나 직렬로 연결된 복잡한 모델도 하나의 시스템 안에서 추정한다. 각 매개 경로의 상대적 영향력을 통계적으로 비교하여 어떤 경로가 더 지배적인지를 규명할 수 있다. 이는 연구자가 제안한 이론적 메커니즘 중 가장 핵심적인 경로가 무엇인지 명확히 밝혀내는 데 도움을 준다. 모델 수정 지수를 활용하여 이론적으로 타당한 범위 내에서 모델을 개선해 나가는 탐색적 접근도 가능하다. 또한 직접효과와 간접효과를 분리하여 총효과가 어떻게 구성되는지를 체계적으로 보여준다. 분석 과정에서 발생하는 변수들 간의 상관관계를 통제함으로써 인과 추론의 논리적 결함을 최소화한다. 이러한 정교함 덕분에 구조방정식은 단순한 회귀분석을 넘어선 고차원적 통계 기법으로 각광받고 있다.


7.png


현대적인 구조방정식 분석에서는 부트스트래핑 기법을 결합하여 간접효과의 유의성을 검증하는 것이 일반적이다. 과거에는 구조방정식 내에서 소벨 검정을 사용하기도 했으나 최근에는 비모수적 추정 방식이 대세로 자리 잡았다. AMOS나 Mplus와 같은 소프트웨어는 구조방정식 모델 내에서 수천 번의 재표본 추출을 수행하는 기능을 제공한다. 이를 통해 산출된 신뢰구간은 잠재변수 간의 간접효과가 0이 아님을 통계적으로 확증해 준다. 측정 모델의 신뢰성과 구조 모델의 유의성을 동시에 확보함으로써 연구 결과의 강건성을 극대화한다. 또한 다집단 분석(Multi-group Analysis)을 통해 집단 간 매개 경로의 차이를 검증하는 고급 분석으로 확장되기도 한다. 이는 특정 모델이 서로 다른 집단에 동일하게 적용되는지를 확인하는 중요한 절차다. 결과적으로 구조방정식과 부트스트래핑의 결합은 매개효과 분석의 학술적 완성도를 높이는 결정적인 역할을 수행한다.


구조방정식 모델링을 활용한 연구는 이론적 가설을 검증하는 것 이상의 학문적 가치를 창출한다. 연구자는 잠재변수 간의 인과 지도를 그림으로써 현상의 이면에 깔린 복잡한 메커니즘을 시각화할 수 있다. 분석 결과로 도출되는 표준화 경로 계수는 각 변수 간 영향력의 크기를 직관적으로 이해하게 돕는다. 모델 적합도가 낮게 나올 경우 이론적 가설의 수정을 검토하며 학문적 논의를 심화시키는 계기가 된다. 이는 단순히 가설의 채택과 기각을 결정하는 수준을 넘어 이론의 경계를 확장하는 과정이다. 또한 다양한 통제변수를 모델에 포함시켜 외생적 요인의 간섭을 최소화한 상태에서 매개효과를 관찰한다. 데이터의 질적 수준이 높을수록 구조방정식은 더욱 빛을 발하며 정교한 통계적 통찰력을 제공한다. 향후 연구에서도 구조방정식은 매개 메커니즘을 밝히는 가장 강력하고 정교한 분석 틀로서 기능할 것이다.



img.jpg?credential=yqXZFxpELC7KVnFOS48ylbz2pIh7yKj8&expires=1767193199&allow_ip=&allow_referer=&signature=E1%2Br8EdenkkQ6j%2Fyl6yQ5rLL8KQ%3D


3. 조절된 매개효과(Moderated Mediation)


조절된 매개효과는 매개 과정이 진행되는 양상이 제3의 변수에 의해 달라지는 현상을 체계적으로 분석한다. 이는 "왜(Why)"라는 질문에 답하는 매개와 "언제(When)"라는 질문에 답하는 조절을 하나의 모델로 결합한 것이다. 인간의 심리나 사회 현상은 단일한 경로로만 설명되지 않으며 상황적 맥락에 따라 그 효과가 변하기 마련이다. 예를 들어 교육 프로그램의 효과가 학습 동기를 매개로 성적에 영향을 줄 때 성별에 따라 그 크기가 다를 수 있다. 이러한 복잡한 상호작용을 포착함으로써 연구 모델의 현실 설명력을 획기적으로 향상시킨다. 조건부 과정 분석(Conditional Process Analysis)은 이러한 복합적인 인과관계를 수치화하여 보여주는 핵심 기법이다. 매개변수가 종속변수에 미치는 영향이 조절변수의 수준에 따라 어떻게 변하는지를 정밀하게 측정한다. 이는 이론의 정교화를 추구하는 현대 사회과학 연구에서 매우 선호되는 분석 전략이다.


이 방법론은 단순히 조절변수와 매개변수를 각각 투입하는 것보다 훨씬 깊이 있는 통찰력을 제공한다. 조절변수의 특정 값에 따라 매개효과가 유의한 구간과 유의하지 않은 구간을 명확히 구분해 낸다. 이를 통해 연구자는 자신의 가설이 유효한 구체적인 경계 조건을 학계에 제시할 수 있다. 존슨-네이만(Johnson-Neyman) 유의성 영역 분석 등을 병행하여 효과가 변하는 변곡점을 찾기도 한다. 이러한 분석 결과는 정책 결정자나 실무자에게 어떤 대상에게 개입이 가장 효과적일지에 대한 답을 준다. 단순히 '효과가 있다'는 결론을 넘어 '누구에게, 어떤 상황에서 효과가 큰가'를 밝히는 셈이다. 이는 연구의 실천적 함의를 극대화하고 자원의 효율적 배분을 돕는 근거가 된다. 이론과 실제 사이의 간극을 좁히는 데 있어 조절된 매개효과 분석은 매우 유용한 가교 역할을 수행한다.


9788999728501.jpg


현대 통계 소프트웨어의 발전은 복잡한 조절된 매개효과 분석을 더욱 용이하게 만들었다. PROCESS macro의 다양한 모델 번호들은 연구자가 설정한 다양한 형태의 상호작용을 손쉽게 검증하게 해준다. 독립변수와 매개변수 사이를 조절하는지, 혹은 매개변수와 종속변수 사이를 조절하는지를 선택할 수 있다. 각 조건에서의 조건부 간접효과(Conditional Indirect Effect)를 산출하고 그 유의성을 부트스트래핑으로 확인한다. 조절된 매개 지수(Index of Moderated Mediation)를 통해 조절 효과의 통계적 유의성을 단일 수치로 보고한다. 연구자는 이를 통해 자신의 통합 모델이 데이터에 의해 지지되는지를 명확하게 판단할 수 있다. 또한 시각화된 상호작용 그래프를 제시함으로써 복잡한 통계적 결과를 독자에게 효과적으로 전달한다. 기술적 장벽이 낮아지면서 연구자들은 통계 계산보다 이론적 모델의 논리적 구성에 더 집중할 수 있게 되었다.


최근의 연구 동향은 조절된 매개효과를 넘어 조절된 조절된 매개효과와 같은 더 고차원적인 모델로 진화하고 있다. 이는 현실의 다층적인 맥락을 최대한 모델에 반영하여 현상의 본질에 다가가려는 시도다. 하지만 모델이 복잡해질수록 이를 뒷받침할 수 있는 충분한 표본 크기와 이론적 개연성이 확보되어야 한다. 무분별한 변수 투입은 오히려 모델의 해석을 어렵게 하고 과적합(Overfitting)의 위험을 초래할 수 있다. 따라서 연구자는 통계적 유의성 이전에 변수 간의 논리적 연결 고리를 탄탄하게 구축하는 데 심혈을 기울여야 한다. 잘 설계된 조절된 매개 모델은 학문적으로는 이론의 정밀도를 높이고 실무적으로는 맞춤형 해결책을 제시한다. 앞으로도 이 기법은 현상의 복잡성을 존중하면서도 그 질서를 찾아내려는 연구자들에게 핵심적인 무기가 될 것이다. 결론적으로 조절된 매개효과는 현대 사회과학이 추구하는 정교한 인과 추론의 정점을 보여주는 방법론이다.


%EC%8A%AC%EB%9D%BC%EC%9D%B4%EB%93%9C3.JPG?type=w800


4. 잠재성장 매개모델(Latent Growth Mediation Model)


잠재성장 매개모델은 시간의 흐름에 따른 변수의 변화 궤적 자체가 매개 역할을 하는지 분석하는 고차원적 기법이다. 단순한 횡단적 매개분석이 갖는 인과관계의 모호성을 극복하기 위해 최소 3시점 이상의 반복 측정 데이터를 활용한다. 독립변수의 초기치가 매개변수의 변화율에 영향을 주고, 이것이 다시 종속변수의 변화율로 이어지는 과정을 추적한다. 이는 현상의 '상태'가 아닌 '변화의 흐름'이 어떻게 상호작용하는지를 보여준다는 점에서 동태적인 통찰을 제공한다. 개별 연구대상자의 발달 궤적을 고려하면서도 집단 전체의 평균적인 매개 경로를 동시에 추정할 수 있다. 구조방정식의 틀 안에서 잠재요인의 초기치(Intercept)와 변화율(Slope) 사이의 인과 고리를 설정하여 분석한다. 시간적 선후 관계를 엄격히 적용하므로 횡단 연구보다 훨씬 강력한 인과적 증거를 제시한다는 강점이 있다. 따라서 아동의 발달 과정이나 장기적인 정책 효과를 검증하는 종단 연구에서 핵심적인 방법론으로 사용된다.


이 모델은 변화의 시작점과 변화의 속도라는 두 가지 측면에서 매개효과를 세밀하게 해부한다. 초기 상태의 높은 수준이 이후의 변화 속도를 촉진하거나 지연시키는 매개 메커니즘을 구체적으로 확인할 수 있다. 독립변수가 매개변수의 성장을 가속화하고, 그 결과로 종속변수의 긍정적 변화가 유도되는지를 통계적으로 입증한다. 분석 과정에서는 시점 간 측정 불변성(Measurement Invariance)을 확보하여 시간 변화에 따른 측정 도구의 동일성을 먼저 검증해야 한다. 이를 통해 관찰된 변화가 실제 심리적 성장에 의한 것인지 측정 오차에 의한 것인지를 명확히 구분한다. 변화율 간의 상관관계를 넘어 한 변화율이 다른 변화율을 예측하는 경로 계수를 산출함으로써 역동적인 인과 구조를 완성한다. 복잡한 수식만큼이나 풍부한 해석이 가능하여 논문의 이론적 깊이를 더하는 데 매우 효과적인 도구다. 연구자는 이를 통해 현상의 발생 원인뿐만 아니라 그 변화가 지속되는 양상까지도 체계적으로 설명하게 된다.


csd-27-3-723f4.jpg


잠재성장 매개모델을 적용할 때는 결측치 처리와 표본의 크기가 분석의 성패를 결정짓는 중요한 요소가 된다. 종단 데이터의 특성상 피험자의 탈락이 발생하기 쉬우므로 최대우도법(FIML) 등을 통해 데이터의 손실을 최소화한다. 또한 각 시점 간의 간격이 이론적으로 타당하게 설정되었는지와 성장의 형태가 선형인지 비선형인지를 신중히 검토해야 한다. 모델 적합도 지수를 확인하여 설정한 성장 곡선이 실제 데이터의 변화 양상을 잘 반영하는지 확인하는 절차를 거친다. 부트스트래핑을 결합하여 변화율 간에 발생하는 간접효과의 유의성을 엄격하게 검정하는 것이 현대적 추세다. 이는 단순히 "변화했다"는 사실을 넘어 "어떤 변화가 다른 변화를 이끌어냈는가"에 대한 과학적 해답을 제시한다. 최근에는 잠재계층 분석(LCA)과 결합하여 집단별로 서로 다른 성장 매개 경로를 탐색하는 혼합 모델로도 확장되고 있다. 이러한 정교한 접근은 발달 심리학이나 교육학 분야에서 변수 간의 장기적 관계를 규명하는 표준으로 자리 잡았다.


결론적으로 잠재성장 매개모델은 정적인 분석에 머물러 있던 매개 연구를 동적인 영역으로 확장한 혁신적인 기법이다. 인간의 삶이 멈춰있는 스냅샷이 아니라 끊임없이 흘러가는 영화와 같다는 점을 통계적으로 구현해 낸 셈이다. 이 기법을 통해 연구자는 특정 개입이 즉각적인 효과를 넘어 장기적인 변화의 동력으로 작용하는 과정을 증명할 수 있다. 이론적으로는 변화의 원인과 결과에 대한 다층적인 설명을 가능케 하여 학문적 논의의 수준을 격상시킨다. 실무적으로는 어느 시점에 개입하는 것이 변화의 궤적을 긍정적으로 바꾸는 데 가장 효과적인지에 대한 전략적 정보를 제공한다. 데이터 수집의 어려움에도 불구하고 이 모델이 주는 통찰의 가치는 다른 기법이 대체하기 어려울 만큼 독보적이다. 미래의 연구들은 더욱 다양한 비선형 성장 모델을 도입하여 현실의 복잡한 변화 양상을 담아내는 방향으로 발전할 것이다. 연구자는 이러한 고도화된 도구를 활용하여 시간의 흐름 속에 감춰진 진정한 매개 원리를 발견하는 기쁨을 누릴 수 있다.


fer-58-3-333f2.jpg


5. 다층 매개분석(Multilevel Mediation Analysis)


다층 매개분석은 개인이 속한 집단의 맥락적 효과가 매개 과정에 미치는 영향을 동시에 분석하는 고도화된 방법론이다. 사실 이 모델은 그렇게 최신 트렌드는 아니다. 그럼에도 불구하고 매개분석을 다양하겍 할 수 있다는 강점이 있다. 사회과학 데이터는 학생들이 학교에 속해 있거나 직원들이 부서에 속해 있는 것처럼 위계적 구조를 갖는 경우가 빈번하다. 이러한 데이터의 독립성 가정이 위배되는 상황에서 일반 회귀분석을 사용하면 표준오차가 편향되어 잘못된 결론에 이를 위험이 크다. 다층 매개모델은 개인 수준(Level 1)과 집단 수준(Level 2)의 변동을 분리하여 각 층위에서의 매개효과를 독립적으로 추정한다. 예를 들어 개인의 직무 만족이 조직 몰입을 매개로 이직 의도에 미치는 영향이 부서의 분위기에 따라 달라지는지를 분석할 수 있다. 집단 수준의 독립변수가 개인 수준의 매개변수를 거쳐 결과를 산출하는 '2-1-1' 모델 등이 대표적인 분석 형태다. 이는 개인이 처한 환경적 맥락이 개별적인 심리적 메커니즘과 어떻게 조화를 이루는지 보여주는 입체적인 분석 틀이다.


이 분석의 핵심은 집단 간 차이(Between-group)와 집단 내 차이(Within-group)를 통계적으로 명확히 구분하여 해석하는 데 있다. 동일한 매개 경로라 할지라도 개인 수준에서의 작용과 집단 수준에서의 작용은 이론적으로 전혀 다른 의미를 가질 수 있다. 다층 모델은 각 층위에서의 간접효과를 각각 산출하여 현상을 다각도에서 조명할 수 있게 해준다. 특히 집단 수준의 변수가 개인 수준의 매개 경로를 조절하거나 매개하는 복잡한 인과 고리를 정교하게 검증한다. 분석 과정에서는 급내상관계수(ICC)를 확인하여 다층 분석을 적용하는 것이 통계적으로 타당한지를 먼저 판단해야 한다. 만약 집단 간 차이가 유의미하다면 다층 매개분석은 선택이 아닌 필수적인 분석 절차가 된다. 연구자는 이를 통해 개별 구성원의 특성뿐만 아니라 조직이나 지역사회의 영향력을 통합적으로 이해하게 된다. 결과적으로 현상의 발생 원인을 개인적 요인과 환경적 요인의 결합으로 설명함으로써 연구의 외적 타당성을 획기적으로 높인다.


20200908_134116.png?type=w800


다층 매개분석을 수행할 때는 각 층위의 표본 크기가 충분히 확보되어야 안정적인 추정치를 얻을 수 있다. 특히 집단 수준(Level 2)의 표본 수가 적으면 상위 수준의 경로 계수가 불안정해질 수 있으므로 신중한 접근이 필요하다. 최근에는 다층 구조 내에서도 부트스트래핑이나 베이지안 추정법을 활용하여 간접효과의 신뢰구간을 산출하는 방식이 널리 쓰인다. 이는 전통적인 정규성 가정에 의존하지 않고 다층 데이터의 복잡한 분포를 반영하여 검정력을 높여준다. 또한 하위 수준의 변수를 상위 수준으로 합산(Aggregation)할 때 발생하는 통계적 오류를 최소화하기 위해 잠재변수 모델링을 결합하기도 한다. 연구자는 각 층위에서의 직접효과와 간접효과를 보고하며 모델의 적합도를 다각도로 검토해야 한다. 복잡한 데이터 구조를 단순화하지 않고 그 본연의 층위를 살려 분석하는 태도가 학술적 엄밀성을 담보한다. 이러한 치밀한 분석은 현장의 다층적 특성을 반영한 실천적인 대안을 도출하는 데 결정적인 근거가 된다.


결론적으로 다층 매개분석은 "인간은 환경 속에 존재하는 사회적 존재"라는 명제를 통계적으로 가장 잘 구현한 방법론이다. 단순히 개인의 특성만을 분석하는 한계에서 벗어나 조직이나 사회의 구조적 영향력을 매개 모델에 통합시킨다. 이는 거시적 환경 변화가 어떻게 미시적 개인의 심리 과정을 거쳐 행동으로 나타나는지를 선명하게 보여준다. 정책 연구나 조직 행동 연구에서 이 기법은 현상의 복잡성을 반영하는 가장 강력한 분석 도구로 평가받는다. 이론적으로는 미시 이론과 거시 이론을 연결하는 가교 역할을 수행하며 학문의 통합적 발전에 기여한다. 실무적으로는 개인에 대한 처방뿐만 아니라 조직 차원의 환경 개선이 왜 필요한지에 대한 논리적 토대를 제공한다. 앞으로 빅데이터와 공공 데이터의 활용이 늘어남에 따라 다층적 구조를 가진 데이터 분석의 중요성은 더욱 커질 것이다. 연구자는 다층 매개분석을 통해 세상을 더욱 넓고 깊게 바라보는 통찰력을 확보하게 될 것이다.



jce-25-1-269-g1.gif


0. 나오기


조금 어렵게 느껴지지만, 아니 매우 어렵게 느껴지만 그래도 매개효과 분석은 통계적 기술을 넘어 인간과 사회의 복잡한 인과 지도를 그리는 작업이다. 왠만한 분석방법보다 훨씬 더 현실을 반영한 방법론이라고 할 수 있다. 그래서 앞으로 매개효과 분석으로 승부수를 띄우려고 한다. 나를 포함한 다 연구자들은 단순한 수치적 유의성에 매몰되지 않고 이론적 근거를 바탕으로 모델을 설계해야 한다고 생각한다. 이제 곧 성균관대 국정전문대학원에 입학한다. 마지막 기회라고 생각하고 통계와 분석 방법에 대한 전문성을 쌓아야 한다. 고려대에서 배운 방법론과 이론에 더해서 더 세밀하고 정부운영에 대한 방법론들을 익혀야 한다. 그래서 2026년에는 다시 처음부터, 새로운 마음으로 다시 시작하려고 한다.


오늘 분석에서 얻은 인사이트를 몇 개 정리해보자. 첫째로 분석 기법의 선택에 있어 데이터의 특성과 연구 목적에 부합하는 현대적 방법론을 적극 도입해야 한다는 것이다. 부트스트래핑은 이제 선택이 아닌 필수적인 절차로 인식되어야 하며 신뢰구간 보고를 정례화해야 한다. 둘째로 구조방정식을 활용하여 측정 오차를 통제하고 모델의 전체적인 정합성을 따지는 다각적인 접근이 필요하다. 셋째로 조절변수를 결합한 통합 모델을 통해 연구의 외적 타당성과 실제적 응용 가능성을 넓혀야 한다. 넷째로 시간적 선후 관계를 명확히 입증할 수 있는 종단적 데이터를 확보하려는 노력이 병행되어야 한다. 다섯째로 분석 결과의 해석에 있어 효과 크기의 실질적인 의미를 독자에게 친절하게 설명하는 태도가 요구된다. 여섯째로 연구의 재현성을 높이기 위해 사용된 통계적 옵션과 절차를 투명하게 공개하는 문화를 정착시켜야 한다. 이러한 체계적인 접근은 매개효과 분석이 가진 학문적 가치를 한 단계 더 격상시킬 것이다.


매개효과 분석의 미래는 방법론적 엄밀성과
이론적 통찰력의 조화로운 결합에 달려 있다.


연구자는 끊임없이 발전하는 통계 소프트웨어와 새로운 알고리즘에 관심을 가지고 학습을 게을리하지 말아야 한다. 빅데이터 시대에 발맞춰 대규모 샘플을 활용한 정교한 매개분석은 더욱 복잡한 사회 문제를 해결하는 열쇠가 될 것이다. 또한 질적 연구와의 혼합 설계 등을 통해 매개 과정에 대한 심층적인 이해를 도모하는 것도 좋은 방향이다. 통계적 수치는 현상을 설명하는 수단일 뿐이며 진정한 가치는 그 숫자가 담고 있는 인간에 대한 이해에서 나온다. 따라서 분석의 모든 과정에서 연구 윤리를 준수하고 데이터 왜곡을 방지하려는 철저한 자기 검열이 필요하다. 그러니깐 여기서도 엄밀성이다. 앞으로 AI의 발전에 따라서 연구계는 엄격한 기준을 통해 쌓아 올린 연구 결과들을 바탕으로 지식의 지평을 넓혀갈 것이다. 연구자의 치밀한 설계와 현대적 방법론의 만남은 사회과학을 더욱 과학적이고 신뢰받는 학문으로 만들 것이다. 마지막으로 이 모든 분석의 지향점은 결국 더 나은 세상을 위한 실천적 대안 제시로 귀결되어야 한다는 것이다. 배워서 남주고, 남주려면 더 열심히 공부해야 한다. 개인적으로 2026년은 엄밀성의 시대가 열린다는 생각이 든다.


https://www.youtube.com/watch?v=C8IFVcbeAFQ


https://www.youtube.com/watch?v=ajXPSDd6QsI


https://www.youtube.com/watch?v=85SwqN3oyVY&list=PLPE47AQ_-MLF03YArDTvsxWWR043nzwy1


https://www.youtube.com/watch?v=bl8qEdj8Om8&t=1s



keyword