brunch

You can make anything
by writing

C.S.Lewis

by 정경문 Apr 22. 2023

데이터로 '카지노'와 '오징어 게임' 다시 보기

호구형은 왜 파산했을까?

# 1. 드라마 카지노에서 차무식, 양정팔, 호구형의 공통점


우린 10년 만에 700억을 벌었어


OTT 드라마 카지노에서 배우 최민식의 깊이 있는 명대사입니다.  

드라마의 제목처럼 이야기는 카지노를 둘러싸고 돈과 배신에 관한 이야기가 펼쳐지는데요,


저는 데이터 관점에서 에피소드를 풀어나가 보겠습니다.

출처 : 디즈니플러스 카지노
위 사진 속, 세 사람의 공통점은 무엇일까요?


드라마에서 양정팔(左; 이동휘), 그리고 호구형이라고 불리는 정석우(右上; 최홍일), 최무식(右下, 최민식) 세명의 공통점은 무엇일까요? 정답은 "카지노에서 도박으로 파산했다."입니다. 왜 그들이 하나같이 파산한 것일까요? 아니, 파산할 수밖에 없었던 걸까요?


이유는 바로 데이터로 증명되는 확률과 통계를 무시했기 때문입니다.

"형, 저 진짜 끝난 거죠?"

"너 형이 그렇게 얘기했잖아. 한 100번은 얘기했을 거다.
  네가 도박 관리하는 놈이 응, 임마, 네가 도박을 왜 해?"


도박을 관리하는 사람들은 정확히 알고 있습니다.

하지만 도박을 하는 사람들은 모르고 있는 것 같습니다.


게임을 반복하면 할수록 얻을 수 있는 이익은 "0"으로 수렴한다는 사실을 말이죠.

게임을 통해 기대할 수 있는 이익, 이것을 좀 유식한 말로 "기댓값"이라고 합니다.



# 2. 오징어 게임의 기댓값(Expectation)


뭐,,라고,, 했지??
짝이요..


이제 다른 OTT의 드라마 '오징어 게임'으로 넘어가 보겠습니다.

기훈과 일남처럼, 여러분이 친구와 구슬로 홀짝 게임을 한다고 가정해 볼게요.

출처 : 넷플릭스 오징어게임

게임의 규칙은 구슬을 1개 걸고 홀수와 짝수를 말합니다. 구글개수의 홀짝수를 맞추는 경우,

구슬 1개를 얻고(+1), 틀리면 구슬을 1개를 잃습니다(-1). 아주 간단하죠.


이때, 우리가 얻을 수 있는 경우는 +1 또는 -1 이므로, 이 두 경우의 확률은 각각 1/2씩 됩니다.

그리고 건 구슬의 개수에 확률을 각각 곱한 값을 더해주면, 우리가 얻을 수 있는 기댓값을 구할 수 있습니다.

따라서 기댓값은 (1개 x 1/2) + (-1개 x 1/2) = 0개가 됩니다.


그렇다면 구슬을 많이 걸면 이 값이 늘어나나요?

구슬을 10개 걸었을 때 계산 해보면, (10개 x 1/2) + (-10개 x 1/2) = 5 - 5 = 0개.  이것은 구슬의 홀짝을 걸어서 기대할 수 있는 구슬의 평균값이 0개이라는 것을 의미합니다. 다시 말하면 이 게임에서 베팅금액이 커도 기댓값이 커지지는 않습니다.


이것을 데이터로 활용하기 위해 수학적인 표현을 빌려보겠습니다. 수학이 싫어도 돈을 벌어준다면야 까짓 거 못할 이유가 없죠?!


기댓값(E) = 베팅금액(X) * 이길 확률(Probability)  + 베팅금액(X) * 질 확률(Probability)

이것을 좀 더 일반화해보면 아래 식과 같이 표현합니다.

베팅금액(X)을 걸었을 때 기댓값(E)은 모두 더해(Σ; 시그마) 줍니다.

무엇을 더하냐면, 나올 수 있는 모든 경우에 대해 베팅금액(X)과 해당 사건이 발생할 확률(P)의 곱을 더해주는 거죠.


여기서 주목할 만한 점을 좀 전에 이야기했습니다. 위 홀짝 게임에서 베팅금액이 크거나 작음에 상관없이 "확률"에 따라 기댓값이 결정되었습니다. 그럼 우리는 이제 "확률(Probability)"에 주목해 보기로 합니다.



# 3. 확률(Probability)에 주목하자.


홀짝의 첫 번째 판에서 이길 확률은 얼마일까요?

홀과 짝 둘 중 하나니까, 1/2 = 50%입니다.


그럼 두 번째 재판은 어떨까요?

역시 마찬가지로 1/2 = 50%입니다.

이때, 첫 번째에서 이겼다고, 또는 졌다고 두 번째 판에서 이길 확률이 늘어나거나 줄어들지 않잖아요.

이것을 조금 있어 보이는 말로 첫 번째 판과 두 번째 판이 서로 '독립적(Independant)이다.'라고 합니다.


<독립사건>
두 사건이 서로 독립일 때,
연달아 동시에 일어나는 경우의 확률 = 확률 A와 확률 B를 서로 곱하면 됩니다.


확률이 독립적일 때, 내가 홀짝 두 판을 연달아 이길 확률은 아래와 같이 계산합니다.

0.5 x 0.5 = 0.25 = 25%


마찬가지로 세 판을 연달아 이길 확률은

0.5 x 0.5  x 0.5 = 0.125 = 12.5%


오징어 게임에서 최초에 10개의 구슬을 가지고 홀짝 게임을 시작합니다.

베팅할 수 있는 구슬의 수, 그리고 홀짝 정답도 랜덤으로 설정하고 게임을 반복합니다.

상대방의 구슬 10개를 다 따서, 남은 구슬이 20개가 되면 승리로 게임이 끝나고,

반대로 내 구슬 10개를 다 잃게 되어, 남은 구슬이 0개가 되면 패배로 게임이 끝납니다.


오징어 게임 홀짝 - 데이터 분석 시뮬레이션


이것을 반복하면서 데이터 분석 프로그램(Python)으로 구현하면 아래와 같이 표현할 수 있습니다

100 세트 게임을 한 것으로 시뮬레이션했을 때, 승률이 48%로 계산되었네요.

결국 승률은 50%에 수렴하면서 두 참가자 모두에게 공평한 게임이 되는 것입니다.



오징어 게임의 홀짝 구슬 게임은 확률이 50% 인 아주 공정한 게임인 반면에, 카지노에서 하는 게임은 어떨까요? 이제 본격적으로 왜 드라마 카지노의 주인공들이 이모두 파산했는지를 알아보겠습니다.



# 4. 왜 그들은 파산했을까?


카지노 룰렛 게임 규칙


룰렛은 참가자가 원하는 곳에 베팅을 하고, 딜러가 빙글빙글 돌아가는 회전판에 구슬을 떨어뜨려서 멈춘 숫자에 따라 승패와 배당을 정하는 게임입니다. 원판 위 숫자는 1부터 36까지의 숫자와 0, 00이 있습니다.

룰렛 베팅 방법을 정리하면 아래와 같습니다.

* 1에서 36까지의 숫자... ① 스트레이트 베팅

* 제로 (0, 00)

* 짝수 / 홀수... ②

* 빨강 / 검정... ③

* 1에서 12까지(1st), 13에서 24까지(2nd), 25에서 36까지(3rd)

* 1에서 18까지, 19에서 36까지... ④

* 1에서 3씩 더해서 34까지, 2에서 3씩 더해서 35까지, 3에서 3씩 더해서 36까지(2 to 1)


가장 이해하기 쉬운 베팅은 숫자에 거는 ① 스트레이트 베팅입니다.

스트레이트 베팅의 경우에는 38개의 숫자 중 하나에 베팅을 하므로, 당첨 확률이 1/38(약 2.63%)입니다. 이에 대한 배당은 건 돈의 35배로 매우 높아 보입니다. 하지만 바로 여기가 카지노에서 돈을 버는 포인트입니다. 반대로 드라마 주인공들이 파산한 이유이기도 합니다.

스트레이트 베팅 게임에서 100달러를 가지고 1달러씩 베팅하는 경우, 위에서 배운 확률과 기댓값을 이용해서 구체적으로 계산해 보겠습니다.  

첫 번째 게임 :             승률: 1/38 (약 2.63%)

예상 손실 : 1달러 x (1 - 1/38) = 약 0.9737달러

예상 이익 : 35달러 x (1/38) + (-1달러) x (1 - 1/38) = 약 -0.0526달러
               (즉, 1달러를 베팅할 경우, 평균적으로 0.0526달러의 손실이 예상됩니다.)


게임을 반복할수록 기댓값의 마이너스(-)는 점점 커지게 됩니다. 예를 들어, 스트레이트 베팅을 계속 반복할 경우, 위에서 계산한 것처럼 장기적으로는 38번 중 1번 정도만 당첨되므로, 약 2.63%의 승률을 가지게 됩니다. 그러나, 이에 대한 배당은 35배이므로, 1/35 = 2.85% 장기적으로는 승률 -5.26%가 됩니다. 이러한 이유로, 카지노에서는 게임을 많이 반복하면 할수록 플레이어가 이기기 어렵도록 디자인되어 있습니다.


카지노 룰렛 - 데이터 분석 시뮬레이션


마찬가지로 데이터 분석 프로그램(Python)으로 구현하면 다음과 같습니다.

가로축은 게임의 반복 횟수이고, 세로축은 남은 돈입니다.


한 번에 1달러씩만 베팅을 했다고 가정해 보았습니다.

100번 게임을 했을 때는 돈을 따는 것처럼 보입니다. 그리고 1000번 반복했을 때부터는 잔액을 나타내는 값이 점점 아래로 내려갑니다. 그리고 1,000,000번(백만 번) 반복해 보면 그 추세를 명확하게 인지할 수 있습니다. 즉 룰렛게임은 반복하면 반복할수록 파산할 수밖에 없는 것이 데이터 분석으로 증명된 셈입니다.


100번 게임했을 때(왼쪽)            /  1,000번 게임했을 때(가운데)  /    1000,000번 게임했을 때(오른쪽)



오징어 게임에서의 홀짝과 같은 둘 중 하나를 맞히는 게임 ②, ③, ④ 도 마찬가지입니다.

/ 베팅과 블랙/레드,  1~18/19~36 베팅의 승률이 50% 아닌 이유는 0 00 있는 미국식 룰렛에서 발생합니다. 0 00 빨간색과 검은색, 그리고 홀수와 짝수  어떤 쪽에도 속하지 않기 때문에,  경우에는 항상 카지노 측에게 유리하게 됩니다.


따라서, 미국식 룰렛에서 홀짝 베팅과 블랙/레드 베팅의 실제 승률은  47.4% 정도가 됩니다. 이런 식으로 계속 게임을 하면 아래와 같이 잔액이 0으로 수렴하게 됩니다.



# 5. 앞으로 개인과 기업에서 필요한 능력


이러한 확률과 기댓값은 카지노에서만, 수학책에서만 쓰일까요? 아닙니다.

확률과 기댓값은 기업의 다양한 분야에서 활용되며, 예측과 의사결정에 있어서 중요한 역할을 합니다.


예를 들어, 마케팅 분야에서는 광고 효과 예측을 위해 확률과 기댓값을 사용할 수 있습니다. 광고를 노출시킨 후 구매 또는 방문 등의 행동을 측정하여, 해당 광고의 효과를 평가합니다. 이때, 과거의 데이터를 바탕으로 구매 확률과 방문 확률을 예측하고, 이를 기반으로 광고 노출 시 기대되는 효과를 계산합니다. 이렇게 계산된 기댓값을 기반으로 광고 예산을 분배하고, 효과가 좋은 광고에 더 많은 예산을 투자하는 전략을 수립할 수 있습니다.


금융 분야에서는, 투자 수익률 예측을 위해 확률과 기댓값을 사용할 수 있습니다. 특정 자산에 대한 수익률의 분포를 분석하고, 과거의 수익률 데이터를 바탕으로 해당 자산의 기대수익률과 위험성을 예측합니다. 이를 기반으로 투자 전략을 수립하고, 투자 수익률을 극대화할 수 있습니다.


또한, 생산 공정에서는 불량률을 예측하기 위해 확률과 기댓값을 사용합니다. 생산된 제품의 일부를 샘플링하여 불량률을 측정하고, 이를 바탕으로 생산 공정의 안정성을 평가합니다. 불량률의 확률분포를 분석하고, 이를 기반으로 불량률의 기댓값을 계산합니다. 이를 통해 생산 공정에서 발생할 수 있는 불량률의 범위를 예측하고, 이를 최소화하기 위한 대응책을 수립할 수 있습니다.


디지털화로 인한 데이터의 폭발적 증가


이처럼 확률과 기댓값은 기업의 다양한 분야에서 예측과 의사결정에 사용됩니다. 정확한 데이터 수집과 분석을 통해 적절한 확률분포와 기댓값을 계산하고, 대응하는 것이 중요합니다.


더군다나 오늘날에는 과거에 비해 활용할 수 있는 데이터들이 상상도 못 할 정도로 늘어나고 있습니다. 그로 인해 과거에는 계산할 수 없었던, 분석할 수 없었던 현상들에 대한 해결방안이 나오고 있습니다. 이때 우리에게 필요한 능력은 바로 문제를 나누는 능력, 문제를 데이터로 해결할 수 있는지 없는지 판단하고, 구분하는 능력, 인공지능을 활용할 수 있는 능력입니다.



우린 10년 만에 700만 원을 벌었어


데이터에 대한 이해가 없을 때, 통장잔고는 늘 바닥이었습니다. 데이터에 기반한 결정이 아니니 재테크도 오래가지 못했습니다. 사실 재테크를 비롯한 개인의 삶과 이익을 창출하는 회사 업무에서의 의사결정 모든 것은 데이터에 기반하고 있었습니다. 언제나 데이터가 옳다는 말이 아닙니다.


정확히 얘기하면 데이터에 기반한 선택은 내가 결정에 대한 신뢰를 줍니다. 그리고 그 믿음은 단호한 결단력과 지속적인 행동의 원천이 됩니다. 불완전한 우리 사람의 결정에 대해 살아있는 데이터라는 거울에 비춰보고, 실시간으로 변하는 세상의 잣대로 결정을 수정할 수 있습니다.


올바른 데이터에 대한 이해와 활용을 통해 우리 삶을 Play 하셨으면 좋겠습니다.

감사합니다.


매거진의 이전글 브런치스토리에서 출판까지의 과정
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari