brunch

You can make anything
by writing

C.S.Lewis

by 도안 Dec 29. 2022

2.2.2 선형회귀 (예제: 광고와 매출)

소규모사업을 위한 데이터분석 마케팅 기법

요가원을 창업하였습니다. 새로운 회원을 모집하고 매출을 늘리기 위해 5주간 인스타그램 광고를 하였습니다. 광고를 하는 것이 매출증대에 영향을 주었는지 알고 싶습니다. 선형회귀를 이용하여 광고비 지출과 매출에 관계를 확인할 것입니다.


선형회귀

파이썬을 이용하여 선형회귀를 구하겠습니다. 엑셀을 사용하여 같은 결과를 얻을 수 있습니다.

차트를 보면 주 단위로 인스타그램에서 지출한 광고비와 매출액을 확인할 수 있습니다. 광고비가 높을수록 매출액이 커지는 것으로 보입니다. 시각화 해보겠습니다.


1) 산점도


x축은 광고비 지출, y축은 매출액을 나타냅니다. 광고비 지출이 많을수록 매출액도 큰 것이 뚜렷합니다. 독립변수 X와 종속변수 Y의 관계는 산점도를 그려봄으로써 직관적으로 이해할 수 있습니다. 직선을 찾기 위해 선형회귀를 돌려보겠습니다.



2) 선형회귀로 직선 찾기 


산점도에 직선을 추가함으로써 데이터 포인트가 직선에 가깝게 있는것을 확인할 수 있습니다. 상관계수가 높고 광고비와 매출액의 관계가 명확합니다.  


2) 선형회귀 결과 해석 

선형회귀의 결과표를 출력하였습니다. 광고와 매출에 관계가 있는지 파악하는 것이 목적이기 때문에 R값(R-sqaured)과 P값을 살펴보아야 합니다. R값은 0~1사이의 값을 갖는데 결과 표를 보면 0.956이 나왔습니다. 따라서 광고비와 매출은 관련이 매우 높습니다. P값(P>|t|)은 0.004로 0.05보다 작으므로 인스타_광고비 변수는 통계적으로 유의합니다.

 

결과표를 이용하여 선형회귀식을 만들어 보겠습니다.

a와 b를 표에서 찾아 대입하면 다음과 같습니다.

Y = a +bX

Y = -0.00059 + 4.8735X

광고비를 1원 투입할 때 마다 매출은 약 4.8배 증가 합니다. 만약 광고비를 30000만원 투입하면 146,205원의 매출이 발생할것으로 예측할 수 있습니다. (30000x4.8735)

주의할 점은 예측할 때 독립변수가 회귀식을 만들 때 사용한 데이터를 넘어서는 안됩니다. 데이터에서는 100,000원이 투입된 최고 광고비인데 그 이상의 광고비가 투입된다면 회귀식이 달라질 수 있습니다.

이 결과는 요가원 운영에 큰 도움이 됩니다. 광고비 지출에 따른 결과가 명확하기 때문에 예산을 세우고 자신있게 광고를 실행할 수 있습니다.


선형회귀를 돌려서 한 개의 독립변수와 그 결과로 나타나는 종속변수의 관계를 확인하였습니다. 독립변수가 여러 개일 때도 선형회귀를 사용할 수 있습니다. 선형회귀의 원리는 단순하지만 응용하면 매출예측, 재고관리, 인력채용에도 활용할 수 있습니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari