brunch

매거진 B2B 마케팅

You can make anything
by writing

C.S.Lewis

by 김홍진 Mar 18. 2024

표본추출방법_1. 확률표본 추출

고객만족도 조사 대상 추출 방법

고객만족도를 조사해야 하는 경우 모든 모수를 측정할 수 없는 문제가 발생한다.

경제적, 시간제약 등의 어려움으로 인해 일부 샘플을 표본으로 추출하여 조사해야 할 경우가 있다.

이런경우, 표본을 어떻게 추출하느냐에 따라 조사의 결과는 모수를 예측함에 있어 정확한 모수를 예측하기 위해서는 표본 추출 방법을 정밀하게 설계해야 할 것이다.



우리가 최근 다양한 기관에서 여론조사 결과가 쏟아져 나오고 있는데 최대한 모수의 결과를 정확하게 예측하기 위해서는 표본을 어떻게 추출할 것인가에 대한 명확한 방향 수립이 선결되어야 한다.

이러한 표본 추출 방법은 확률 추출과 비확률 추출로 나누어 지는데, 우선 확률적 표본 추출 방법에 대해서 살펴본다.


모든 대상이 표본으로 선택될 확률이 동일한 방법입니다. 확률 표본 추출 방법은 표본 오류를 줄이고 모집단을 대표하는 표본을 얻을 수 있다는 장점이 있지만, 표본 추출 과정이 복잡하고 시간과 비용이 많이 드는 단점이 있습니다.

확률 표본 추출법은 표본의 수를 지속적으로 증가하면 표본오차는 점점 제로에 가깝게 되는 성질을 갖고 있다.


1. 단순 무작위 표본 추출 (Simple Random Sampling)

모집단의 모든 대상을 목록화하고, 무작위로 선택하는 방법입니다. 가장 기본적인 확률 표본 추출 방법이지만, 모집단의 목록을 작성하는 것이 어렵거나 시간이 많이 소요될 수 있습니다.

무수히 생산되는 건전지에서 그냥 임의로 표본을 선택하는 것이다. 이 때 선택하는 기준은 특별히 없다.

이때 난수표나 엑셀의 난수함수를 활용하여 표본을 뽑을 수도 있다.

전체 크기가 N인 모집단에서 크기 n인 표본을 추출할 때 모든 표본이 추출될 확률이 동일하게 추출하는 방법이다.


예시: 복권 추첨, 무작위로 난수발생하여 표본 추출

장점:  가장 간단하고 이해하기 쉬운 방법, 표본 오류가 가장 작음

단점:  모집단의 목록을 작성하는 것이 어렵거나 시간이 많이 소요될 수 있음, 대규모 모집단에서는 실제로 적용하기 어려울 수 있음


2. 계통 무작위 표본 추출 (Systematic Random Sampling)

모집단의 모든 대상을 일정한 간격으로 나열하고, 시작점을 난수를 발생하여 무작위로 선택한 후 그 간격으로 표본을 선택하는 방법입니다. 단순 무작위 표본 추출보다 표본 추출 과정이 간단하지만, 모집단의 대상들이 일정한 간격으로 분포되어 있지 않으면 표본 오류가 발생할 수 있습니다.

전체 모집단에서 일정한 간격으로 표본을 추출하는 방법으로서, 모집단의 크기가 N이고 표본의 크기를 n이라고 할때 처음 k(=N/n)개의 모집단에서 첫번째 표본을 추출하고 다음 k번째마다 한개씩의 표본을 추출하는 방법이다.

우리가 학교에서 선생님이 모집단인 반 전체 학생 35중에서 5명을 뽑아서 문제를 풀어보게 할 경우, 35/5=7이므로 처음 무작윈 표본을 3을 뽑고 간격(k)만큼 10번, 17번, 24번, 31번을 뽑아서 문제 풀어보라고 했을 때, 선생님은 계통 무작위 표본추출법을 사용하여 표본을 뽑은 것이다.


예시:  전화번호부에서 일정한 간격으로 번호를 선택, 설문조사 대상자를 일정한 간격으로 선정

장점:  단순 무작위 표본 추출보다 표본 추출 과정이 간단, 대규모 모집단에도 적용 가능

단점:  모집단의 대상들이 일정한 간격으로 분포되어 있지 않으면 표본 오류가 발생할 수 있음


3. 층화 무작위 표본 추출 (Stratified Random Sampling)

모집단을 특정한 기준으로 층으로 나누고, 각 층에서 무작위로 표본을 선택하는 방법입니다. 모집단의 특성을 잘 반영하는 표본을 얻을 수 있지만, 층을 나누는 기준에 따라 표본 오류가 발생할 수 있습니다.

계층으로 구분할 때 명확한 기준이 없으면 각 층간의 이질성을 확보할 수 없는 문제가 발생할 수 있다.

중학생을 대상으로 설문을 할 경우, 각 층으로 나누어진 1학년, 2학년, 3학년을 기준으로 각 층에서 무작위로 표본을 추출하는 경우가 이에 해당된다.


예시:  성별, 연령, 지역별로 층화하여 표본 추출, 소득 수준, 학력별로 층화하여 표본 추출

장점:  모집단의 특성을 잘 반영하는 표본을 얻을 수 있음, 표본 오류를 줄일 수 있음

단점:  층을 나누는 기준에 따라 표본 오류가 발생할 수 있음, 층화 과정이 복잡하고 시간이 많이 소요될 수 있음


4. 군집 무작위 표본 추출 (Cluster Random Sampling)

모집단을 군집으로 나누고, 무작위로 군집을 선택한 후 그 군집에 속한 모든 대상을 표본으로 선택하는 방법입니다. 대규모 모집단에 적용하기 용이하지만, 군집 내의 대상들이 서로 유사할 경우 표본 오류가 발생할 수 있습니다.

이렇듯 각 군집의 동일성과 각 군집 구성원의 상이성을 확보하기 어려워 고객만족도 조사에서는 잘 사용하지 않는 방법니다.


예시: 학교를 군집으로 나누고, 무작위로 학교를 선택하여 학생들을 표본으로 선택, 
        지역을 군집으로 나누고, 무작위로 지역을 선택하여 주민들을 표본으로 선택

장점:  대규모 모집단에 적용하기 용이, 표본 추출 과정이 비교적 간단

단점:  군집 내의 대상들이 서로 유사할 경우 표본 오류가 발생할 수 있음






브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari