brunch

You can make anything
by writing

C.S.Lewis

by 해라 Aug 28. 2020

업무에 활용하는 통계 개념 : 단순 선형 회귀분석

통계 이론 | 통계 분석 | 데이터 분석

이 매거진은 업무에 활용하는 통계 개념이라는 제목으로 수회 차 연재될 예정이며, 개념에 대한 설명과 이 개념을 업무에 활용할 방법에 대해서 설명합니다.


이전 글에서는 데이터 분석 방법 중 상관분석에 대해 소개하고, 업무에 이 통계 분석을 활용하는 스킬을 설명하였습니다.

이 글에서는 데이터 분석 방법 중 회귀분석, 그중 가장 간단한 단순 선형 회귀분석에 대해서 소개합니다.


이 글과 함께 읽으면 좋은 글을 아래에 링크합니다.

마케터에게 필요한 '기초 통계 개념' 바로가기 >

업무에 활용하는 통계 개념 : 기술통계&추리통계 바로가기 >

업무에 활용하는 통계 개념 : 상관분석 바로가기 >




회귀분석이란 연속형 변수들에 대해 변수들 간의 관계를 추정하는 분석 방법입니다.

회귀분석은 독립변수가 종속변수에게 미치는 영향을 확인할 수 있는 분석 방법으로 이전 글에서 설명했던 상관분석과 달리 인과 관계를 예측할 수 있는 분석 방법이기도 합니다.

* 상관분석에 대한 자세한 설명은 업무에 활용하는 통계 개념 : 상관분석에서 확인할 수 있습니다.


회귀분석은 단순 선형 회귀분석(Simple linear regression), 다중 선형 회귀분석(multiple linear regression), 다항 회귀분석(polynomial regression), 로지스틱 회귀분석(Logistic Regression) 등 여러 종류가 있으며 오늘은 가장 간단한 회귀분석 방법인 단순 선형 회귀분석에 대해 설명하겠습니다.


1. 단순 선형 회귀분석(Simple linear regression)

회귀분석이란 앞서 이야기한 것처럼 독립변수가 종속변수에게 미친 영향력을 분석하는 것입니다.

단순 선형 회귀분석은 독립변수가 1개, 종속변수가 1개 일 때의 회귀분석 방법입니다.

'선형'이라는 이름에서 알 수 있듯이, 단순 선형 회귀분석은 선형 예측 모델을 찾는 것입니다.


선형 예측 모델은 아래의 그래프와 같이 나타낼 수 있습니다.

빨간색 직선이 선형 예측 모델

선형 예측 모델인 빨간색 직선의 회귀식은 아래와 같습니다.

Y=α+βX+e
(Y는 종속변수, X는 독립변수, α는 절편, β는 기울기, e는 오차)

이 회귀식은 우리가 중학교 수학에서 배웠던 아래의 일차함수와 유사합니다.

일차함수 y = ax + b (a≠0)
(a는 기울기, b는 y절편)

일차함수에서 기울기 a의 값에 따라 그래프의 경사도가 달라지듯이, 회귀식에서도 기울기 β의 값에 따라 그래프의 경사도가 달라집니다.

또한 일차함수에서 y절편 b값에 따라 그래프의 위치가 달라지듯이, 회귀식에서도 절편 α의 값에 따라 그래프의 위치가 달라집니다.

즉, 회귀식에서는 기울기 β의 값과 절편 α의 값을 알아내는 것이 핵심입니다.


2. 회귀분석의 해석

회귀분석은 논문에서 많이 볼 수 있습니다.

아래는 논문에서 자주 볼 수 있는 통계표 예시입니다.

이 표에서 우리가 알아야 하는 항목은 상수, 비표준화계수(B), R², F, 유의확률, t(t분포)가 있습니다.


각 항목들의 개념을 간단히 설명하면 아래와 같습니다.

- 상수 : 회귀식에서 절편 α의 값을 나타냅니다.

- 비표준화계수(B) : 회귀식에서 기울기 β의 값을 나타냅니다. 비표준화계수가 +(양수)이면 독립변수가 증가하면 종속변수도 증가하는 것을 나타내고, 비표준화계수가 -(음수)이면 독립변수가 증가하면 종속변수는 감소하는 것을 나타냅니다.

또한, 비표준화계수(B)와 t분포에 따른 유의확률로 가설(연구가설) 채택 여부를 판단합니다.

- R² : 독립변수와 종속변수의 상관관계를 나타냅니다.

* 상관관계에 대한 자세한 설명은 업무에 활용하는 통계 개념 : 상관분석에서 확인할 수 있습니다.

- F와 유의확률 : 회귀선이 모델에 적합한지에 대한 회귀모형 적합성을 확인할 수 있습니다. 유의확률이 0.05 미만이면 회귀선이 모델에 적합함을 나타냅니다.


요약하여 설명하자면, 상수와 비표준화계수(B)를 알면 회귀식을 완성할 수 있는 것입니다.

* 물론 그 회귀모형 적합성과 연구가설 채택 여부를 판단할 필요는 있지만, 이런 부분에 대해서는 추후 다중 선형 회귀분석에 대한 소개와 함께 회귀분석 결과를 해석하는 방법을 설명하며 다루도록 하겠습니다.





지금까지 업무에 활용하는 통계 개념 중 단순 선형 회귀분석에 대해 설명했습니다.

단순 선형 회귀분석도 상관분석과 마찬가지로 Excel 데이터 분석 기능을 활용하여 자동으로 계산할 수 있습니다.

단순 선형 회귀분석과 다중 선형 회귀분석 모두 Excel 데이터 분석 기능을 활용하여 계산할 수 있으므로 다중 선형 회귀분석에 대해 소개할 때 함께 설명드리겠습니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari