brunch

You can make anything
by writing

C.S.Lewis

by 김이사 Aug 06. 2019

결국에는 확률이 승리한다.

그들이 그렇게 자신 있었던 이유

예전에 한 통계학과 교수님이 학생들한테 낸 특이한 과제 이야기를 들은 적이 있다. 학생들에게 주사위를 던져서 나온 숫자를 모두 기록하되 반드시 충분한 횟수를 던져야 한다는 조건이 있었다. 그리고 며칠 후, 학생들의 과제를 제출했을 때 교수님은 학생이 숙제를 성실히 했는지 or 대충 무작위로 숫자를 적어온 건지 한눈에 알아봤다는 이야기였다. 이 이야기를 언제 어디서 들었는지 도무지 기억이 나질 않는다. 그런데 결론도 생각이 나지 않았았다. 도대체 교수님이 어떻게 알아낸 거지? 그 궁금증이 지금까지 해소가 되지 않았었는데, 이 책 <벌거벗은 통계학>을 읽다 보니 자연스레 답을 찾게 되었다.


단서는 충분한 횟수를 던져야 한다는 것이었다. 이것은 "대수의 법칙"(=큰 수의 법칙)으로 설명할 수 있다. 시도 횟수가 늘어나면 결과의 평균은 기댓값에 가까워진다는 것이다. 예를 들어 동전 던지기를 10회 했을 때 앞면이 나오는 횟수는 종잡을 수 없다. 하지만 100회 혹은 1000회를 한다면 앞면이 나올 확률이 전체의 반에 점점 가까워진다. 위에서 소개한 교수님이 과제를 보고 성실도를 판단할 수 있었던 것도 대수의 법칙에 따른 것이다. 즉 교수님이 요구한 대로 충분히 주사위를 던졌다면 각 숫자가 나온 확률은 1/6에 가깝게 나왔어야 한다. 이 법칙을 알고 보면 다음의 한 맥주회사의 무모해 보이는(?) 광고의 의도를 파악할 수 있다. 


1981년 조지프 슐리츠 양조회사는 170만 달러를 들여 아주 놀라울 정도로 대담하고 위험해 보이는 마케팅 전략을 세웠다. 바로 전 세계 1억여 명의 시청자가 시청하는 슈퍼볼 하프타임에 자사의 맥주와 경쟁사 맥주를 생방송에서 블라인드 테스트를 하기로 한 것이다! 참가자 100명은 랜덤이 아닌 경쟁사 맥주를 즐겨마시는 사람들로 뽑았다. 이 맥주 블라인드 테스트는 매회 플레이오프 본 경기만큼이나 인기가 있었다. 슐리프 양조회사는 쇠락하고 있었던 상황이었고 엄청난 광고료를 지급한 이 마케팅의 성패에 따라 회사의 운명이 달려있다고 해도 과언이 아니었다. 이 블라인드 테스트에서 슐리츠는 반드시 다른 맥주 애호가들이 자신의 맥주를 선택하게 만들어야 했다. 그들은 무모했을까? 아니면 영리했을까?



짐작했겠지만 슐리츠는 영리했다. 그들이 이렇게 과감한 전략을 선택한 이유가 있다. 


1. 이것은 동전 던지기와 같은 50% 확률이었다. (기댓값: 50%)

슐리츠가 속한 제품군에 있는 맥주들은 대부분 맛이 비슷하다. 그러므로 일반 사람들이 슐리츠를 다른 경쟁사의 맥주들과 구분하지 못한다고 한다면 블라인드 테스트는 기본적으로 동전 던지기와 같은 것이다. (더구나 슐리츠는 자사의 단골 고객에게 이 테스트를 실시하지 않음으로써 자사 브랜드를 좋아하는 맥주 애호가들이 경쟁사를 선택하여 자신이 입을 위험 부담을 완전히 배재했다)


2. 누적 확률 수치를 확인했다.

블라인드 테스트의 각 선택이 서로 영향을 미치지 않는다고 했을 때, 한 맥주를 선택할 확률을 50%라고 하자. 서로 다른 모든 결과의 확률을 계산했을 때 참가자 중 최소한 40명이 슐리츠를 선택할 가능성은 98%였고, 최소한 45명이 슐리츠를 선택할 가능성은 86%였다. 테스트 참가자 100명 모두 미켈롭을 선택할 가능성은 참가자 모두가 소행성에 맞아 사망할 확률보다 낮았다. (게다가 참가자들은 이미 경쟁사 맥주를 좋아한다고 밝혔으니 핑계를 댈 여지도 있었다)



결국 통계에 대한 확실한 이해가 그들을 이렇게 자신 있게 만들었다. 특히 그들은 대수의 법칙을 활용했다. 블라인드 테스트를 10회만 했다면 결과는 예측불가였을 것이다. 하지만 그들은 10명보다 100명에게 시음을 하도록 했다. 아래 확률 밀도 함수를 보면 10회, 100회, 1000회를 시도할 때 결과는 더욱 평균값에 가까워진다는 사실을 알 수 있다. 


확률 밀도 함수 (출처: 벌거벗은 통계학)


대수의 법칙은 장기적으로 봤을 대 카지노가 항상 돈을 버는 이유를 설명해준다. 내가 카지노에서 충분히 오랜 시간 동안 충분한 액수의 돈을 건다면 돈을 잃는 경우가 확실히 많은 것이다. 복권의 경우도 마찬가지다. 꾸준히 오랜 시간에 걸쳐 복권을 사면 돈을 잃을 확률은 점점 더 커진다. 오늘 복권을 사서 5000원에 당첨될 수도 있다. 내일 복권을 사도 연속으로 5000원에 당첨될 수도 있다. 하지만 복권을 사는데 100만 원 혹은 1000만 원을 소비한다면 내가 받을 수 있는 금액은 점점 기댓값에 가까워진다. (참고로 로또의 기댓값은 총판매량의 50%를 상금으로 나눠주고 있기 때문에 판매 가격의 절반 정도 혹은 절반보다 낮다고 한다)


많은 사람들이 일확천금의 기회를 막연히 바라는 상황에서 위에 언급한 '대수의 법칙'을 이해하면 어떻게 될까? 우리가 기대하는 '우연'(=기댓값의 오차범위)은 횟수가 늘어날수록 점차 줄어든다는 것이라는 사실을 안다면? 결과의 평균은 기댓값에 점점 가까워진다는 확률의 교훈을 안다면 감수할 가치가 있는 위험과 그렇지 않은 위험을 구분하는 데 도움이 될 것이다. 최소한 막연한 우연에 기대어 성공을 점치는 일은 줄어들 것이다. 


물론, 통계가 모든 것의 해답을 줄 수는 없다. <벌거벗은 통계학>에서 찰스 윌런은 통계가 가진 함정도 분명히 알고 있다. 그는 누군가가 지나치게 간소화된 통계를 사용해 사람들을 설득하는 상황을 경고한다. 


중앙값이나 평균만 나타나는 이유는 간결함을 위해서거나
누군가가 통계를 이용해 '설득'을 하고자 하기 때문이다.

-<벌거벗은 통계학>, p.93


이럴 경우, 우리가 통계에 대한 이해가 없다면 오해를 갖기가 너무 쉽다. 사람들은 항상 단순한 답을 좋아하지만 통계값의 간소화는 세부 사항의 상실을 가지고 올 수밖에 없가 때문이다. 통계에 대한 지나친 믿음이 잘못된 결론으로 이어지거나 바람직하지 않은 행동을 하게 만들 수도 있다. 수능 점수가 학생들 각각의 특징(개개인성)을 반영하지 못하는 것처럼 말이다. 그리고 수능 점수의 잣대로 아이들을 평가하게 된다면 의도치 않은 결과로 이어질 수 있기 때문이다. 


하지만 우리가 통계에 대한 장점과 단점을 잘 알고 그것을 활용할 수 있게 된다면 어떻게 될까? 우리가 평균과 중간값의 차이를 정확히 안다면 누군가 우리를 설득하려고 할 때 그 정보를 가지고 판단할 수 있게 될 것이다. 대수의 법칙을 이해하고 있다면 슐리츠 양조회사에서 하는 광고가 무모한 도전이 아닌 탁월한 마케팅 아이디어라고 판단할 수 것이다. 통계에 대한 최소한의 이해는 세상을 정확한 눈으로 바라보게 만들 것이다. 더 나아가 통계를 영리하게 이용하는 방법을 공부 한다면 내가 하는 일의 성공 확률은 확실하게 높아질 것이다.


참, 슐리츠 양조회사의 마케팅 결과는 어땠을까? 정확하게 50명이 슐리츠를 선택했다! ^^ 


Schlitz vs Michelob during Super Bowl XV 1981 (출처: 유튜브)


#벌거벗은통계학 #씽큐베이션 #체인지그라운드 #실력은어떻게만들어지는가

작가의 이전글 재능을 타고났다는 이야기를 들으면 정말 화가 납니다.
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari