통계 이론 | 통계 분석 | 데이터 분석
이 매거진은 업무에 활용하는 통계 개념이라는 제목으로 수회 차 연재될 예정이며, 개념에 대한 설명과 이 개념을 업무에 활용할 방법에 대해서 설명합니다.
이 글에서는 세 가지 평균값에 대해서 소개하고, 업무에 이 통계 분석을 활용하는 스킬을 다룹니다.
이 글과 함께 읽으면 좋은 글을 아래에 링크합니다.
업무에 활용하는 통계 개념 : 평균·분산·표준편차 바로가기 >
데이터 분석에서 평균은 가장 자주 쓰이는 지표입니다. 오늘은 세 가지 평균값에 대해 설명하겠습니다.
우리가 흔히 아는 평균인 '합의 평균'을 의미합니다.
즉, 데이터의 총합을 데이터의 개수로 나눈 값입니다.
일 평균 방문자 수, 인당 평균 클릭 수, 평균 구매 금액 등을 구할 때 사용됩니다.
연평균 성장률, 평균 수익률 등을 나타내는 '곱의 평균'을 의미합니다.
기하평균은 모든 데이터의 값을 곱한 값의 n제곱근을 구한 값입니다. (* n은 데이터 개수)
즉, 기하평균은 연속된 기간 동안의 곱셈적 변화를 반영합니다.
예를 들어서 한 회사의 2년 동안의 매출이 첫 번째 해에는 5%, 두 번째 해에는 10% 성장했을 때 연평균 성장률은 (1.05 × 1.10)^½ - 1 = 7.47%로 기하평균을 이용해서 구할 수 있습니다.
기하평균을 이용하면 단순하게 산술평균으로 연평균 성장률을 구하는 것보다 정확한 성장률을 구할 수 있습니다.
평균 속도 등을 나타내는 평균으로 '역수의 산술평균의 역수'를 의미합니다.
조화평균은 주어진 데이터 개수를 각 데이터 값의 역수의 합으로 나눈 값입니다.
평균 속도 계산, 주식의 평균 P/E 비율 등을 구할 때 사용됩니다.
예를 들어서 특정 장소에 갈 때 10m/s, 올 때 20m/s로 이동했을 때 평균 속력은 2 ÷ (1/10 + 1/20) =13.33m/s로 조화평균을 이용해서 구할 수 있습니다.
조화평균은 특정 상황에서 비중 또는 가중치를 고려한 평균을 구할 때 적합합니다.
평균값은 데이터 분석에서 가장 자주 쓰이는 지표입니다.
오늘 설명한 세 가지 평균값을 상황에 맞게 적절하게 선택해서 올바른 데이터 분석을 하시길 바랍니다.