도대체 내가 좋아하는 것을 어떻게?

카이제곱 분포의 세계

by 김응석
카이1.png

아주 단순하게 만든 표가 있다.

10대, 20대, 30대 이상으로 고객을 구분해서 각자가 선호하는 콘텐츠의 종류가 어떤 것인지 정리한 표다.

왜 이 표를 만들었을까?

이 표를 통해서 세대별로 선호하는 콘텐츠의 종류가 차이가 있는지 확인하여 향 후 마케팅이라든지 기획이라든지 하는 영역에 활용하기 위해서일 것이다.

표만 언듯 봐서는 세대와 콘텐츠의 종류가 어떤 관계가 있는지 확인하는 것은 쉽지 않다.

아래 그림을 보자.

카이2.png

그림을 보면 10대는 액션물, 30대는 다큐멘터리를 선호하고 20대는 액션과 로맨스 중간에 있음을 알 수 있다. 이렇듯 세대와 콘텐츠 종류와의 관련성등을 확인하기 위해 활용하는 분포가 카이제곱(χ2) 분포다.

마케팅을 담당하는 사람이라면, 성별, 지역 또는 세대에 따라서 브랜드 이미지가 어떻게 다른지, 직업군(학생, 직장인, 자영업자 등) 별로 제품 구매 패턴(온라인, 편의점, 마켓 등)이 어떠한 차이가 있는지, 광고를 본 사람과 그렇지 않은 사람 간에 구매 욕구의 차이가 있는지 등등을 확인하고 싶을 것이다. 이러한 분석을 하기 위해서 보이지 않는 곳에서 많은 역할을 하고 있는 아주 착한 분포가 바로 카이제곱 분포다.



카이제곱 분포는 표준정규분포(Z)를 제곱해서 만들었다 좀 더 정확하게 표현하면 여러 개의 독립적인 표준정규분포를 각각 제공한 다음 더하면 카이 제곱 분포가 된다. 이때 몇 개의 표준정규분포를 사용했는지를 알려주는 것을 자유도라고 한다. 표준정규분포 하늘 제곱하면 자유도 1의 카이제곱분포가 된다.




나는 금성사로 입사를 해서 LG전자에서 퇴사를 했다.

왜 금성에서 LG로 바꾸었을까?

신혼부부가 대리점을 방문했을 때 부모님이 계신다면 LG제품을 구매하는 경우가 많았고, 신혼부부끼리 방문했을 경우에는 삼성 제품을 구매하는 경우가 많았었다는 이야기를 들은 기억이 난다. 회사의 브랜드를 변경하는 것은 여러 가지를 고려해서 결정했겠지만, 대리점에서의 현상이 우연에 의한 것인지 아닌지를 잘 확인할 수 있도록 도와주는 것이 카이제곱 분포의 역할이다.

keyword
작가의 이전글기상이변의 시대 강수량은 어떻게 예측할까?