brunch

You can make anything
by writing

C.S.Lewis

by 뷰저블 Beusable Jun 17. 2020

데이터의 허와 실, 평균의 함정과 심슨의 역설!

평균이라는 데이터의 함정, 올바르게 데이터 분석하기!


안녕하세요, 뷰저블입니다! 여러분은 데이터 분석 결과를 어떻게 해석할지 수치를 의심해본 적 있으신가요? 데이터 분석 결과를 단순한 평균값만으로 판단하는 것은 굉장히 위험합니다.


아래 기사를 예로 살펴볼까요? 20대 초반 사회초년생의 평균 임금이 200만원이라고 합니다. 과연 이 수치가 올바르다고 말할 수 있을까요? 대다수가 ‘20대 초반 평균 임금이 200만원이라고? 말도 안되는 결과잖아?’라고 생각할 것입니다. 대기업 직원의 평균 임금 또한 7천 920만원이라고 하지만, 정유사 등 제한된 업종에 아니라면 체감 연봉은 그렇게 높지 않을 수 있습니다.





평균이라는 데이터의 함정 유의하기


데이터 분석 또한 마찬가지입니다. 고객의 평균 장바구니 사이즈가 5개라고 하더라도 대다수 사람들이 2~3개를 구매하고 떠날 수 있습니다. 일부 도소매 업자로 보이는 사람들이 수백 수천개의 물건을 구매하는 경우가 있을 수 있죠.


따라서 평균값을 분석할 때는 데이터를 시각화해서 전체 분포를 파악하고 범위 내에서의 데이터를 해석할 수 있어야 합니다.



그렇다면 실무에서 평균의 함정은 어떤 것이 있을까요? 또 어떻게 이 함정에 빠지지 않을 수 있을까요?


뷰저블 블로그에서 평균값의 함정에 대한 다양한 사례들을 공유드리고, 뷰저블로 평균의 함정을 피하는 방법을 소개해드립니다!



평균의 함정을 더 알고싶으시다면? 
아래 링크에서 전체 글을 확인하실 수 있습니다!

데이터의 허와 실, 평균의 함정과 심슨의 역설!




숫자 대신, 히트맵으로 시작하는 데이터 분석!

서비스의 중요한 고객들의 데이터를 한 눈에 보세요!

UX with Beusable.

beusable.net

beusably.net

beusable.net/blog/



매거진의 이전글 뷰저블로 비대면 사용성 테스트 손쉽게 진행하기!
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari