반복측정 ANOVA

동일한 관측 대상에 대한 측정 시점의 변화 검정

by Yimhyehwa



1. Learning Focus


우리는 현재 평균 차이의 통계적 유의성을 검정하는 과정을 학습 중입니다. 먼저 단일표본 t-검정을 통해 하나의 평균이 기준 값과 통계적으로 유의한 차이를 보이는지 검정했습니다. 다음으로 독립표본 t-검정을 통해 서로 다른 두 집단의 평균 차이를 통계적으로 검정했습니다. 이어 대응표본 t-검정에서는 같은 대상을 두 번 측정했을 때 평균의 차이에 유의한 변화가 있는지 검정했습니다. 그리고 일원분산분석(One-way ANOVA)을 통해 서로 독립된 세 집단 이상의 평균 차이를 검정했습니다. 또한 등분산 가정이 깨진 경우에 대안전 분산분석 방법으로 Welch ANOVA에 대해 살펴봤습니다.


이번 시간에는 분산분석의 또다른 검정 방법으로 같은 관측 대상을 세 번 이상 측정하는 경우를 살펴보고자 합니다. 예를 들어, 모바일 앱 어플리케이션 업데이트 후 사용자(유저)의 체류시간을 업데이트 전, 1주 후, 4주 후로 측정하거나 어떤 교육훈련 프로그램의 효과를 교육 전, 교육 직후, 교육의 한 달 후로 측정하거나 광고 UI의 개편 영향을 1차, 2차, 3차 버전으로 나눠 반복 측정하는 경우입니다.


이런 경우 서로 독립된 집단으로 가정하고 ANOVA를 실행할 수 없습니다. 왜냐하면 각 시점의 값들이 서로 독립된 것들이 아니라 같은 대상에서 반복적으로 측정된 값이기 때문입니다. 이처럼 같은 관측 대상을 세 번 이상 반복 측정하는 평균의 비교 방법이 반복측정 분산분석(Repeated Measures ANOVA) 입니다.


2. 왜 독립집단 ANOVA를 사용하면 안 되는가


예를 들어 모바일 앱 어플리케이션 업데이트에 따른 사용자의 체류시간을 Before, Week1, Week4 세 시점으로 나누어 측정했다고 가정하겠습니다. 이러한 Data Set을 독립집단 ANOVA 방식으로 검정하게 되면, 마치 세 시점의 값이 서로 다른 세 개의 집단에서 나왔다고 가정하는 셈이 됩니다.


하지만 실제로는 그렇지 않습니다. 사용자마다 원래 앱을 많이 쓰는 사람도 있고, 적게 쓰는 사람도 있습니다. 이러한 개인의 차이는 Before, Week1, Week4에 공통적으로 반영됩니다. 즉 같은 사용자(관측 대상)의 세 개의 값은 서로 상관되어 있는 것입니다. 반복측정 ANOVA는 바로 이러한 구조의 특성을 고려합니다. 즉, 개인의 차이를 분리하고 순수하게 시점의 효과만을 검정하는 방법입니다.


3. Data Set: 주간 평균 앱 체류시간(분)


이번 단원에서는 모바일 앱 어플리케이션 업데이트 전후 사용자의 체류시간 변화에 관한 Data Set을 활용하겠습니다. 이 Data Set에서 측정된 변수는 "주간 평균 앱 체류시간(분)" 입니다. 같은 사용자 10명을 세 시점에서 측정했다고 가정하겠습니다. Before은 업데이트 전, Week1은 업데이트 1주 후, Week4는 업데이트 4주 후입니다. 각 행이 한 명의 사용자이고, 각 열이 반복측정 시점입니다.



4. 가설 설정


이 Data Set에 대해서 알고자 하는 것은 "모바일 앱 어플리케이션 업데이트 이후 사용자들의 평균 앱 체류시간이 시점에 따라 유의한 차이가 있는가?" 입니다. 즉, 단순히 업데이트 전과 후의 차이가 있는지를 묻는 것이 아니라 Before, Week1, Week4 세 시점 전체에서 평균의 차이가 존재하는지를 살펴봅니다.


반복측정 ANOVA의 귀무가설은 [H0: μ_Before=μ_Week1=μ_Week4] 입니다. 세 시점의 평균은 모두 같다는 기본적인 가설입니다. 반면, 대립가설은 [H1: 적어도 하나의 시점 평균은 다르다] 입니다. 이는 앞선 단원에서 살펴봤던 일원분산분석의 가설 구조와 동일합니다. "모든 평균은 다르다."라는 것이 아니라 "적어도 하나의 평균은 다르다."라는 것입니다.


5. 기술통계량 확인


우선 각 시점의 [평균]을 구해보겠습니다. 아래와 같이 평균을 계산하면, [Mean_Before]=31.1, [Mean_Week1]=33.3, [Mean_Week4]=36.2가 나옵니다. 즉, 업데이터 전을 시작으로 업데이트 4주 후 시점까지 시점 별로 증가하는 패턴을 보이고 있습니다. 하지만 이러한 평균의 차이가 통계적으로 유의한지 검정이 필요합니다.



6. 전체 변동분 계산


반복측정 ANOVA는 전체 변동을 ① 시점 간 변동(Time Effect), ② 개인 간 변동(Subject Effect), ③ 잔차 오차(Residual Error)로 나눕니다. 즉, 전체 변동분을 측정할 때 사람마다 원래 수준이 다른 점에 기인하여 발생하는 변동을 분리한 후, 시점에 따른 효과가 얼마나 남는지를 보려고 합니다. 이것이 서로 다른 집단에 대해 적용하는 ANOVA와 확연히 다른 점입니다.


6-A. 전체 평균 계산(Grand Mean)


이 Data Set은 n=30 입니다. Before(n=10)의 데이터 합은 311, Week1(n=10)의 데이터 합은 333, Week4(n=10)의 데이터 합은 362로 전체 합계는 1,006입니다. 따라서, [전체 평균(x-bar_G)=1,006/30≒33.53] 입니다.


6-B. 전체 제곱 합(SS_Total)


전체 변동분은 개별 데이터 포인트가 전체 평균(Gran Mean)에서 얼마나 떨어져 있는지를 계산한 후 이를 제곱하여 모두 더한 값입니다. 즉, 아래와 같은 수식으로 계산합니다.


위 수식을 활용하여 계산하면 Before의 경우 216.111, Week1의 경우 156.644, Week4의 경우 226.711이 나옵니다. 따라서, 전체 변동량의 총합은 [SS_Total=599.467] 입니다.



6-C. 시점 제곱 합(SS_Time)


반복측정 ANOVA에서 시점 효과는 각 시점의 평균이 전체 평균에서 얼마나 떨어져 있는지를 계산합니다. 이에 아래와 같은 수식으로 정리할 수 있습니다.



여기서 n=10은 사용자의 수를 뜻합니다. 각 시점의 평균 차이를 계산하면 다음과 같습니다.

Before: 31.1-33.53=(-)2.43

Week1: 33.3-33.53=(-)0.23

Week4: 36.2-33.53=(+)2.67


따라서, 시점 제곱 합(SS_Time)은 아래와 같이 약 130.867이 나옵니다.



6-D. 개인 제곱 합(SS_Subjects)


이제 각 사용자 평균이 전체 평균에서 얼마나 떨어져 있는가를 살펴보겠습니다. 개인 차원의 변동 부분은 다음의 공식을 통해 계산됩니다.



여기서 [k=3], 즉 시점의 수입니다. 이 값은 "관측 대상(유저)마다 모바일 앱 체류시간의 수준 자체가 제각각이다."라는 전제로 발생하는 변동분을 뜻합니다. 위 공식을 사용하여 개인의 제곱 합을 계산하면 약 467.467이 나옵니다.



6-E. 오차 제곱 합(SS_Error)


이제 남은 오차 [SS_Error]를 계산해보겠습니다. ① SS_Total=599.467, ② SS_Time=130.867, ③ SS_Subjects=467.467 입니다. 따라서 [SS_Error=①-②-③=1.133] 입니다. 이 값은 "개인 차원의 변동분을 제거하고도 남아 있는 시점 효과 이외의 오차"라고 할 수 있습니다.


6-F. 자유도(df) 계산


반복측정 ANOVA에서도 당연히 자유도를 고려해야 합니다. 우리가 이 Data Set에서 갖고 있는 [전체 정보의 양]을 먼저 계산하겠습니다. 표본은 총 30개(유저 10명×3 시점)로, 전체 자유도는 29(=30-1) 입니다. 반복측정 ANOVA의 핵심은 이 29라는 정보를 세 개의 바구니로 분할하여 담는 것입니다.


① [ 시점 간 차이(df_Time) ]의 경우 3개이므로, 시점 간 변화를 설명하는데 쓰는 정보량은 2(=3-1) 입니다. ② [ 유저 간 차이(df_Subjects) ]의 경우 10명이므로, 사람들 사이에서 원래의 수준 차이를 설명하는 데 쓰이는 정보량은 9(=10-1) 입니다. ③ 마지막으로 남은 정보량이 [ 오차(df_Error) ]인데, 산술적으로는 29-2-9=18 입니다.


오차에 대한 자유도는 상호작용(Interaction)의 관점에서 볼 필요가 있습니다. 반복측정 ANOVA에서 오차는 단순히 측정 실수가 아니라 "사람마다 시점에 따라 변하는 패턴이 서로 다르다."라는 것을 의미합니다. 이를 "유저×시점 상호작용"이라고 부릅니다. 따라서 오차에 대한 자유도는 [ (3-1)×(10-1)=18 ]로 계산할 수 있습니다. 따라서 오차에 대한 자유도는 마지막으로 남은 정보량을 산술적으로 계산하든 아니면 상호작용의 관점에서 계산하든 동일한 값이 나옵니다.


7. 평균 제곱 계산


반복측정 ANOVA는 동일한 관측 대상에 대한 세 시점의 평균 차이의 유의성을 검정하는 것이므로 [시점의 평균 제곱 합(MS_Time) ]과 개인 차원의 변동분을 제하고 남은 [ 오차의 평균 제곱 합(MS_Error) ]의 비율을 계산하여 F-통계량을 도출합니다. 이에 아래와 같이 계산하면, F-통계량=1,039가 나옵니다. 즉 시점 간의 변동이 개인 차원의 변동분을 제거하고 남은 오차에 비해 약 1,000배 이상 현저하게 크다는 뜻입니다.



8. 통계적 유의성 확인


F-값의 자유도는 df1=2, df2=18이고, 유의수준=0.05에서 판별하겠습니다. 아래와 같이 유의수준 0.05에서 임계 값은 대략 3.55 정도입니다. 우리가 계산한 F-통계량이 현저히 크기 때문에 귀무가설을 기각할 수 있습니다. 즉, 세 시점의 평균 체류시간은 동일하지 않다는 것입니다. p-value 관점에서 p<.001로 볼 수 있기 때문에 "모바일 앱 어플리케이션 업데이터 전, 1주 후, 4주 후 체류시간 평균이 모두 같다는 귀무가설 아래에서 지금과 같은 정도의 시점 차이가 우연히 관찰된 가능성은 매우 낮다."라고 해석할 수 있습니다.


Reference: Saskatchewan Organization for Heritage Languages (SOHL). (n.d.). F-Distribution Table. Retrieved from https://www.saskoer.ca/app/uploads/sites/313/2020/05/F-Distribution-Table.pdf


9. 사후 검정①: 구형성 검정


반복측정 ANOVA의 검정도 다른 일반 ANOVA 검정과 마찬가지로 "적어도 하나의 시점 평균은 다르다."라는 것까지 알 수 있습니다. 즉, 이것만으로는 Before와 Week1, Before와 Week4, Week1과 Week4가 서로 다른 지를 모두 알 수 없습니다. 그래서 검정 결과 통계적인 유의성이 인정된다면, 사후비교가 필요합니다.


9-A. 구형성(Sphericity) 개념의 등장


반복측정 ANOVA에서는 이 사후 검정과 관련하여 중요한 개념이 등장합니다. 이른바 구형성(Sphericity)입니다. 구형성은 기하학의 관점에서 어떤 물체가 완벽한 구(공)에 얼마나 가까운지를 측정하는 척도로서 정의됩니다.


이미지 제공: Google Gemini(Dall-E 3 생성)


수학적으로 가장 완벽한 입체인 공을 1의 값으로 잡아보겠습니다. 이렇게 완벽한 공의 모양을 기준으로 두고 특정 물체의 겉넓이와 부피를 계산하여 이것과 얼마나 차이가 나는지를 따져보는 것이 구형성의 원리입니다. 1에 가까울수록 매끈한 축구공 같고, 숫자가 낮을수록 길쭉하거나 울퉁불퉁한 모양(럭비공 등)을 갖는다고 볼 수 있습니다. 통계학에서는 구형성의 수치를 나타내는 기호로 ε(엡실론)을 씁니다. 위 이미지에서는 기하학에서 구형성을 나타내는 기호로 Ψ(프시)를 씁니다.


반복측정 ANOVA는 바로 이 구형성의 개념을 시점 간 차이의 분산에 적용합니다. 만약 시점 간 차이의 분산이 모두 동일하다면, 이를 입체적으로 그렸을 때 모든 방향으로 똑같이 뻗어 나간 완벽한 공 모양으로 간주합니다. 즉, "모든 시점 간의 변화량이 통계적으로 공평(등분산)하다."라는 것입니다. 반복측정 ANOVA는 등분산의 성질을 가정하고 설계된 검정 모델입니다.


같은 관측 대상을 여러 번 반복하여 측정했을 경우, 첫 번째와 두 번째의 측정 값의 차이, 두 번째와 세 번째의 차이, 첫 번째와 세 번째의 차이 등 모든 가능한 쌍들의 분산이 서로 같아야 하며, 이런 가정이 충족되면 실험 대상들이 시간의 흐름에 따라 또는 조건의 변화에도 불구하고 비교적 일관된 변화 패턴을 보인다는 것입니다.


구형성의 가정에 위배될 경우 이를 무시하고 분석하게 되면, 통계 프로그램은 실제보다 "차이가 아주 뚜렷하다."라는 착오를 일으킵니다. 즉, "가짜 양성"(False Positive, 제1종 오류)을 불러올 위험성이 높아집니다. 왜 그렇게 되는 것인지 통계적인 메커니즘을 따져보겠습니다.


첫째, F-값이 뻥튀기(분모의 과소평가) 됩니다. 일반적인 분산분석은 구형성 가정에서는 모든 쌍의 분산이 일정하다고 가정하고 하나의 평균적인 오차 값을 분모에 반영합니다. 하지만 구형성 가정에 위배되는 경우 실제로는 시점들 사이에서 오차가 매우 큼에도 불구하고, 통계 분석 모델은 이를 평균내어 실제보다 오차(분모)를 작계 계산해 버립니다. 결국, 분모가 작아지기 때문에 F-통계량이 비정상적으로 커지고, 이렇게 되면 실제로는 차이가 없는데도 p-value가 0.05 이하로 뚝 떨어지는 현상이 발생할 수 있습니다.


반복측정 ANOVA의 경우, 예컨대 특정 시점(time1과 time3) 간의 변화는 불규칙한데, 다른 쌍(time1과 time2)의 경우 일정할 수 있습니다. 이 경우 구형성의 가정이 충족되지 않습니다. 그럼에도 반복측정 ANOVA는 모든 시점 쌍의 변동을 하나의 평균적인 오차값으로 뭉뚱그려 분모에 반영합니다. 그리고 전체 변동에서 시점 간 변동(SS_Time) 부분을 통째로 덜어내고 분모에 남은 오차 값만 반영합니다. 왜냐하면 "시점 1, 2, 3 사이의 모든 변화 패턴은 질적으로 동일한 수준의 변동을 가질 것이다."라고 가정하기 때문입니다. 즉, 시점 간 차이의 평균적인 크기만 계산해서 빼버릴 뿐, 그 안에서 어느 특정 시점들끼리 유독 요동치고 있는지(불균형)를 따지지 않습니다. 이렇게 되면 변동이 심한 구간도 단순 평균화되면서 희석되고, 결과적으로 분모(오차)가 실제 데이터의 변동성보다 "과소평가"되어 F-값이 뻥튀기 되는 효과가 발생합니다.


둘째, 자유도의 오류입니다. 자유도는 '비교할 수 있는 정보량'을 의미합니다. 구형성 가정이 충족될 경우 데이터의 모든 정보가 독립적으로 기여한다고 보고 높은 자유도를 부여합니다. 하지만 구형성 가정이 충족되지 않는다면, 특정 시점들끼리 강하게 묶여 있어(높은 상관성) 실제로 활용 가능한 독립적인 정보량은 적습니다. 즉, 과도하게 높은 자유도를 그대로 반영할 경우 임계치가 낮아져서, 별 것 아닌 차이도 통계적 유의성의 임계치를 쉽게 넘어서게 됩니다.


9-B. 구형성 검정 및 대안적(보정) 방법


구형성 가정에 위배될 경우 통계적 결과가 실제보다 더 유의하게 나올 위험이 있으므로, 구형성 충족 여부에 관한 검정은 필수적입니다. 이를 위해 모클리 구형성 검정(Mauchly's Test of Sphericity)을 사용합니다. 결과 값이 0.05보다 크다면 구형성 위반의 증거가 없는 것으로 간주합니다. 만약 구형성 가정에 위배될 경우에는 자유도를 보정해야 하는데, 자유도를 보정하는 방법에는 그린하우스-가이서(Greenhouse-Geisser, "G-G") 보정, 현-펠트(Huynh-Feldt, "H-F") 보정이 있습니다.


통계 프로그램을 통해 실제 분석에 들어갈 때는 먼저 Mauchly's Test를 확인합니다. p<.05라면, 구형성 가정을 위배한 것으로 판단합니다. 그 다음 엡실론 값을 확인합니다. G-G 엡실론이 0.5 수준이면, 자유도를 반토막 내어 계산하고, H-F 엡실론이 0.9 수준이면 자유도를 10% 정도 깎아서 계산합니다. 이렇게 자유도가 낮아지면 p-value는 올라가게 됩니다. 즉, 구형성 가정이 위배되어 데이터의 신뢰도가 떨어졌으니 더 엄격한 잣대(낮은 자유도)로 평가하겠다는 논리가 적용된 것입니다. 자유도를 보정하는 수준으로 볼 때 G-G 보정이 H-F 보정에 비해 훨씬 엄격하다고 볼 수 있습니다.


9-C. Jamovi를 통한 구형성 검정 결과



Jamovi에서 이 Data Set에 대해 [Repeated Measures ANOVA]를 실행하였고, [Assumption Checks] 를 통해 구형성을 검정하였습니다. ① Mauchly's p=0.476으로 이 값이 0.05보다 크기 때문에 구형성 가정을 충족하는 것으로 나타났습니다. ② 엡실론 값을 보면, G-G 보정에 따를 경우 0.855로 나왔고, H-F 보정에 따를 경우 1.00으로 나타났습니다. H-F 보정 결과 1.00이라는 수치만 봐도 구형성이 잘 지켜지고 있다는 것을 알 수 있습니다. G-G-보정 기준으로 0.75 미만인 경우 구형성 가정에 심각한 위배가 있다고 보는데, 위 결과는 상대적으로 양호한 수치로 나왔습니다.


10. 사후 검정②: 쌍대 비교


다음으로 각 시점을 쌍대 비교하여 구체적으로 얼마의 차이가 나타나고, 그 차이(효과)가 통계적으로 유의한 수준인지를 살펴보겠습니다. 이 역시 Jamovi를 통해 실시하되, [Tukey's HSD] 및 [Bonferroni Correction] 보정 방법을 모두 활용해보겠습니다. 이 두 가지의 검정법은 시점 간 쌍대 비교를 통해 평균 차이의 유의성을 살펴보는 것입니다. 다만, 다중 비교(Multiple Comparison) 시 발생하는 오류를 통제하는 관점이 다소 다릅니다.


앞선 시간에서도 다뤘던 Tukey's HSD는 "(비교군 중) 최대값과 최소값의 차이를 집단 내 변동과 비교"하는 접근법으로 이 집단들 중에서 가장 큰 평균과 가장 작은 평균의 차이가 우연히 발생할 확률을 계산합니다. 다만, Tukey 사후검정은 집단 간 표본의 크기가 같고 등분산일 때 가장 강력한 방법론입니다.


반면, 본페로니 보정(Bonferroni Correction)은 훨씬 단순하고 보수적입니다. 이 보정론은 "비교를 여러 번 하면 제1종 오류의 가능성이 높아지기 때문에 아예 유의수준(α)을 비교 횟수로 나눠버리겠다."라는 접근입니다. 예컨대 원래 유의수준이 0.05이고, 세 번의 비교를 한다면 새로운 유의확률 기준은 0.016이 됩니다. 본페로니 보정법은 비교 횟수가 많아질수록 기준이 굉장히 까다로워지기 때문에, 실제로는 유의한 차이가 있음에도 차이가 없다고 결론을 내릴 확률(제2종 오류)이 높아질 수 있습니다.



위 결과와 같이 어떤 방법론에 따르든 모든 시점의 쌍대 비교에서 통계적으로 유의한 상승이 있었던 것으로 판단됩니다. Before와 Week1 간에는 약 2.2점, Week1과 Week4 간에는 약 2.9점, Before와 Week4 간에는 약 5.1점의 상승이 나타났습니다.


11. 사후 검정③: 효과 크기


반복측정 ANOVA에서 가장 널리 쓰이는 효과크기 지표는 부분 에타 제곱(Partial Eta Squared) 입니다. 일반적인 ANOVA와 달리 반복측정 ANOVA는 개인차(SS_Subjects)를 제거합니다. 그래서 부분 에타 제곱은 아래 공식과 같이 개인차를 제외한 "나머지 변동분" 중에서 시점 효과가 차지하는 비중을 뜻합니다. 즉, 유저마다 다른 부분은 어쩔 수 없고, 그것을 제외했을 때 순수하게 시점의 변화가 얼마나 강력한 효과를 발휘하는 것인지를 보기 위해 '부분'이라는 개념을 사용합니다. 참고로 일반 에타 제곱은 전체 변동분 중에서 시점 효과가 차지하는 비중을 의미합니다.



Jamovi를 통해서 손쉽게 효과 크기를 계산할 수도 있지만, 부분 에타 제곱의 공식이 비교적 간단하여 위와 같이 직접 계산하였습니다. 그 결과 개인차를 제외한 변동의 99.1%가 시점 효과로 설명이 가능한 수준입니다.


약간 각도를 달리하여 '분산의 지분 싸움'의 관점에서 짚고 넘어가겠습니다. 우리가 처음에 계산했던 전체 제곱합(SS_Total=599.467)을 100%라고 놓고 볼 때, 개인차(SS_Subjects=467.467)가 약 78%, 시점차(SS_Time=130.867)가 약 21.8%, 그리고 남은 오차(SS_Error=1.133)가 약 0.2%의 비중입니다. 그렇다면, 약 20%를 조금 넘는 시점 효과가 이 모델에 있어 좋은 설명력을 갖고 있는지 의문이 들 수도 있습니다. 통계학의 관점에서는 이를 "설명력이 약한 것이 아니라, 데이터의 성격이 '개인차'가 지배적인 구조"라고 해석합니다.


심리학이나 사회과학 실험에서 단 하나의 요인이 전체 변동의 20% 이상을 책임지는 경우 매우 강력한 효과로 간주합니다. 보통은 14%만 넘어도 "대단히 큰 효과"로 받아들이기도 합니다. 효과크기(Effect Size)의 해석과 관련하여 제이콥 코헨(Jacob Cohen)은 그의 저서(1998)인 "Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum Associates."에서 ANOVA에서의 설명력의 수준을 아래와 같이 세 단계로 나누고 있습니다.



12. 추정 평균의 오차 정보(Plot)


Jamovi에서 [Estimated Marginal Mean] 측정 기능을 활용하여 아래와 같이 이번 Data Set에 대한 시점 간 중심 및 변동 부분을 Plot 형태로 시각화하였습니다.



위 그래프에서 크게 세 가지 점을 짚어보고 마무리하겠습니다.


첫째, 시점의 효과가 "선형적으로 상승"하는 패턴을 보입니다. Before(31.1), Week1(33.3), Week4(36.2)로 갈수록 평균(흰색 점)이 일정하게 높아지고 있음을 알 수 있습니다. 모바일 앱 어플리케이션 업데이트의 효과가 단기적으로만 나타나는 것이 아니라 장기적으로도 지속적으로 강화되고 있음을 시사합니다.


둘째, 세로 막대(Error Bar)는 "95% 신뢰구간(CI)"을 의미합니다. 이 막대는 실제 모집단의 평균이 존재할 것으로 예상하는 범위를 나타낸 것입니다. 막대의 길이를 보면 세 시점 모두 비슷합니다. 이는 시점별로 데이터가 퍼져 있는 정도가 일정하다는 것입니다. 우리가 앞서 확인했던 구형성 가정이 잘 지켜지고 있다는 시각적인 증거이기도 합니다.


셋째, 막대가 겹치는 부분에 대한 해석입니다. 그래프를 보면 앞 시점의 위쪽 막대와 다음 시점의 아래쪽 막대가 꽤 겹치는 것처럼 보이는 부분이 있습니다. 그래프의 오차 막대에는 개인 차이가 포함되어 있기 때문에 오차 막대의 길이는 길게 보일 수 있습니다. 하지만 반복측정 ANOVA는 이러한 개인의 차이를 제거하고 분석하는 검정 방법이기 때문에, 실제로 '시점 효과'는 그래프에서 보이는 것보다 확실하게 구분된다는 것을 알 수 있습니다.









월, 화, 수, 목, 금, 토, 일 연재