같은 확률, 다른 선택의 이유
[♪ 밝은 음악]
이지은: 안녕하세요, '안개 속을 걷다'의 이지은입니다! 오늘도 불확실성과 친해지는 시간, 함께해요!
어제 온라인 마켓에서 중고 노트북을 하나 발견했는데, 상품 설명에 '거의 새것'이라고 적혀 있더라고요. 사진으로 봐도 깨끗하고, 가격도 괜찮고... 그런데 고민이 되는 거예요.
'이 노트북의 실제 상태가 어떨까?' 제가 나름대로 확률을 매겨봤어요. 판매자 평점, 사진으로 본 상태, 가격대를 종합해 보니... 진짜 좋은 상태일 확률이 60%, 겉만 깨끗하고 성능 문제가 있을 확률이 30%, 심각한 하자가 있을 확률이 10% 정도 되겠더라고요. 그렇다면 이 노트북, 사야 할까요, 말아야 할까요?
[띠링!]
결정을 못하겠더라고요. 제가 매긴 확률은 노트북의 지금 상태에 대한 추측이잖아요. 하지만 정작 알고 싶은 건 '이걸 사면 앞으로 어떤 일이 벌어질까'였거든요. 1년 뒤에도 잘 쓰고 있을지, 아니면 고장 나서 후회하고 있을지. 그래서 한 단계 더 생각해 봤어요. 정말 좋은 상태라면 1년은 거뜬히 쓸 테고, 성능 문제가 있다면 1년을 못 버티고 말썽이 날 거고...
근데 여기까지 생각해도 선택을 못 내리겠더라고요. 50만 원짜리 노트북인데, 사서 1년 동안 잘 쓰는 것과 고장 나서 돈을 날리는 것, 또 안 사고 그 돈을 아끼는 것이 나한테 각각 얼마나 중요한지를 따져봐야 비로소 선택지를 비교할 수 있을 것 같은 거예요!
오늘은 바로 이 문제를 다뤄볼 거예요. 미래에 벌어질 일에 대한 불확실성과 각 결과의 가치를 모두 따져서 어떻게 합리적인 선택을 내릴 수 있을까요? 그리고 그 가치가 사람마다 다르다면, 어떻게 각자에게 맞는 답을 찾을 수 있을까요?
Ep.1에서 우리는 불확실성에 두 종류가 있다고 배웠습니다. 동전 던지기처럼 근본적으로 예측할 수 없는 우연과, 정보 부족에서 오는 무지였죠. 그런데 이런 불확실성 속에서 선택을 내려야 한다면 어떻게 해야 할까요?
지금까지 우리는 가설을 세우고, 각 가설에 확률을 매기고, 새로운 정보가 들어올 때마다 업데이트하는 방법을 익혔습니다. 중고 노트북 구매를 예로 들어봅시다. 판매자 정보를 종합해서 노트북이 양호할 확률 60%, 성능 문제가 있을 확률 30%, 심각한 하자가 있을 확률 10%라는 사후 확률을 구했다고 해봅시다.
하지만 이 확률만으로는 선택을 내릴 수 없습니다. 사후 확률은 노트북의 지금 상태에 대한 믿음, 즉 무지에서 오는 불확실성을 다룬 것입니다. 실제로 구매 후 1년 안에 고장이 날지 아닐지는 우연의 영역이죠. 부품의 수명이나 예기치 못한 충격처럼, 아무리 정보를 모아도 예측할 수 없는 요소가 작용하니까요.
그래서 한 단계가 더 필요합니다. 지금 확인할 수 없는 상태에 대한 믿음을, 앞으로 실제로 겪게 될 결과와 연결하는 것이죠. 50만 원을 들였으니 최소 1년은 문제없이 쓰고 싶겠죠. 각 상태에서 1년 동안 예상되는 결과를 따져봅시다.
눈치채셨을지 모르지만, 이 표의 각 숫자는 이전 에피소드에서 다룬 P(데이터|가설)과 같은 구조입니다. '양호한 상태일 때 1년 안에 문제가 발생할 확률 5%'처럼, 특정 가설이 참이라고 가정하고 그때 어떤 결과가 나올지를 보는 것이죠. 다만 여기서의 데이터는 사후 확률을 구할 때 사용한 판매자 정보가 아니라, 아직 일어나지 않은 미래의 결과입니다. 같은 가설에 대해 새로운 데이터를 연결하는 셈이죠.
P(데이터|가설)을 순방향과 역방향으로 읽을 수 있다는 것을 기억하시나요? 가설을 고정하고 데이터의 확률을 보는 순방향 읽기와, 데이터를 고정하고 각 가설의 지지도를 비교하는 역방향 읽기였죠. 예측에서는 순방향으로 읽습니다. 각 상태가 참이라고 가정한 뒤, 그 상태에서 어떤 미래가 펼쳐질지를 내다보는 것이니까요.
우리가 가진 믿음(사후 확률)을 바탕으로 미래에 일어날 일을 예측하면, 각 결과에 확률이 매겨집니다. 이 결과물을 사후 예측 분포(posterior predictive distribution)라고 합니다. 복잡하게 들리지만, 사실 우리가 일상에서 직관적으로 하는 것과 닮아 있습니다. '이 우산을 가져갈까?'라고 고민할 때, 우리는 비가 올 확률(믿음)을 바탕으로 우산이 필요한 상황이 발생할지(미래 예측)를 생각하잖아요. 사후 예측 분포는 이런 사고 과정의 결과물입니다. 여러 가능한 미래를 머릿속에서 시뮬레이션해 보고 각각에 확률을 매긴 것이죠.
노트북 구매 상황에서 구체적인 숫자로 따라가 봅시다. 전체 확률의 법칙을 사용하면 1년 내 문제 발생 확률을 계산할 수 있습니다. 문제가 발생하는 경우는 세 가지입니다. 현재 상태는 양호하지만 운이 나빠서 문제가 생기는 경우, 성능 문제가 있어서 결국 고장 나는 경우, 그리고 애초에 하자가 있어서 문제가 드러나는 경우죠. 각 경우의 확률은 해당 상태의 사후 확률과 그 상태에서 문제가 발생할 확률을 곱하여 구합니다.
이 표를 확률 기호로 정리해 봅시다. 사후 확률 열의 P(가설)은 판매자 정보로 업데이트를 마친 결과입니다. 이전 에피소드에서는 P(가설|관찰된 데이터)였지만, 미래를 예측하는 지금 맥락에서는 이것이 새로운 출발점이 됩니다. 업데이트가 끝난 사후 확률이 다음 예측의 사전 확률 역할을 하는 것이죠.
1년 내 문제 발생 확률 열은 P(미래 데이터|가설), 즉 각 상태에서 문제가 발생할 조건부 확률입니다. 이 두 확률을 곱하면 P(가설) × P(미래 데이터|가설) = P(가설, 미래 데이터), 즉 결합 확률이 됩니다. '양호하면서 동시에 문제가 발생할 확률'이 3%인 식이죠. 그리고 세 가설이 서로 겹치지 않고 모든 가능성을 포괄하므로, 결합 확률을 모두 더하면 P(미래 데이터) = 3% + 9% + 9% = 21%가 됩니다. 이것이 전체 확률의 법칙입니다.
문제가 발생할 확률 21%, 문제없이 작동할 확률 79%(= 100% - 21%). 그래서 이 노트북, 사야 할까요? 이 질문에 답하려면 한 가지가 더 필요합니다. 각 결과가 나에게 주는 가치입니다. 이것을 효용(utility)이라고 합니다[1,2]. 같은 '1년 내 고장'이라도 사람마다 그 무게는 전혀 다르니까요.
프리랜서 디자이너를 생각해 보세요. 그들에게 노트북은 곧 생계 수단입니다. 갑자기 고장 나면 진행 중인 프로젝트가 멈추고, 고객과의 신뢰가 깨지며, 수입이 끊깁니다. 반면 취미로 유튜브를 보는 사람에게 노트북 고장은 불편할 뿐입니다. 스마트폰이나 태블릿으로 대체할 수도 있고, 며칠 못 본다고 큰일이 나는 것도 아니죠. 그래서 프리랜서에게는 효용이 -100이지만, 취미 사용자에게는 -30에 불과할 수 있습니다. (효용은 단위 없는 상대적 점수입니다 — 숫자 자체보다 프리랜서의 타격이 취미 사용자의 약 세 배라는 비율이 중요합니다.)
돈의 가치도 마찬가지입니다. 대학생에게 50만 원은 한 달 아르바이트 수입일 수 있지만, 직장인에게는 한 달 외식비 정도일 수 있습니다. 은퇴한 어르신에게는 한 달 생활비의 상당 부분일 수도 있고요. 그래서 같은 50만 원을 잃는다 해도 그 효용은 -200일 수도, -50일 수도 있는 것입니다.
효용이 다르면 최적의 선택도 달라집니다. 같은 중고 노트북 앞에서 고민하는 두 사람으로 이를 확인해 봅시다. 구매자 A는 경제적 여유가 있는 직장인이고, 구매자 B는 아르바이트로 생활하는 대학생입니다. 두 사람의 효용 함수는 완전히 다릅니다. 효용 함수란 가능한 각 결과에 자신만의 효용 점수를 매긴 것입니다.
구매자 A의 효용 함수를 봅시다. 노트북이 정상 작동하면(79%) 효용은 +80입니다. 새 제품 대비 절약한 돈으로 다른 것을 살 수 있으니까요. 문제가 발생하면(21%) 효용은 -40입니다. 돈은 아깝지만 감당할 만한 손실이죠. 각 결과의 확률과 효용을 곱해서 더한 기대효용을 계산하면 0.79 × 80 + 0.21 × (-40) = 54.8입니다. 구매하지 않는 것의 효용이 +20이라면, 구매가 훨씬 유리합니다.
반면 구매자 B의 효용 함수는 다릅니다. 노트북이 정상 작동하면(79%) 효용은 +60으로 A보다 낮습니다. 절약의 기쁨은 있지만 원래 돈이 많지 않으니까요. 문제가 발생하면(21%) 효용은 -100으로 훨씬 큰 타격입니다. 다음 달 생활비가 날아가는 것이니까요. 기대효용을 계산하면 0.79 × 60 + 0.21 × (-100) = 26.4이고, 구매하지 않는 것의 효용 30보다 낮습니다. B에게는 구매하지 않는 것이 합리적입니다.
두 사람의 선택지별 기대효용을 표로 정리하면 다음과 같습니다.
같은 확률을 보고도 A는 사고, B는 사지 않습니다. 둘 다 합리적입니다. 개인의 상황과 가치관이 다르기 때문이죠. 정답은 없습니다. 각자에게 맞는 최선의 선택이 있을 뿐이죠.
보험이 왜 존재하는지도 기대효용으로 설명할 수 있습니다. 화재로 집을 잃을 확률은 0.1%도 안 됩니다. 하지만 만약 그런 일이 생긴다면? 감당할 수 없는 재앙이죠. 집을 잃는 것의 효용이 -10,000이라면, 0.1%의 확률이라도 기대효용에 -10의 영향을 미칩니다. 그래서 매달 보험료를 내는 것이죠. 보험회사는 수많은 가입자를 통해 위험을 분산시킬 수 있지만, 개인은 그럴 수 없으니까요. 아주 작은 확률로 발생할 수 있는 큰 손실을 피하기 위해 작은 비용을 기꺼이 치르는 것, 기대효용 관점에서 완전히 합리적인 행동입니다.
베이지안 의사결정 이론[3]은 지금까지의 사고 과정을 세 단계로 정리합니다. 첫째, 직접 확인할 수 없는 현재 상태에 대한 믿음을 확률로 표현한다. 둘째, 각 상태에서 예상되는 미래 결과를 예측한다. 셋째, 각 결과의 주관적 효용을 반영하여 선택지별 기대효용을 계산하고, 가장 높은 선택지를 고른다. 이러한 절차를 통해 불확실성과 주관성을 모두 고려하면서도 체계적으로 최선의 선택을 내릴 수 있습니다.
물론 사람은 계산기가 아닙니다. 실제로 선택을 내릴 때 우리의 심리는 기대효용 계산과 체계적으로 다른 방향을 가리키곤 하죠. 같은 금액이라도 얻는 기쁨보다 잃는 고통이 놀라울 정도로 크고, 같은 정보도 표현 방식에 따라 전혀 다른 선택으로 이어집니다. 다음 시간에는 이런 심리적 편향이 선택에 어떤 영향을 미치는지, 그리고 어떻게 대처할 수 있는지 살펴보겠습니다.
이지은: 오늘 내용이 좀 많았죠? 베이지안 추론에 개인의 가치관을 더하면 나만의 합리적인 선택을 내릴 수 있다는 걸 느끼셨나요?
핵심은 이거예요. 직접 볼 수 없는 것(노트북의 실제 상태)에 대한 믿음을 실제로 경험할 수 있는 것(1년 후 고장 여부)으로 바꾸고, 거기에 주관적 가치(효용)를 더해서 최선의 선택을 하는 거죠!
[띠링!]
오늘의 미션! 여러분이 고민 중인 결정 하나를 골라서 이 과정을 따라 해보세요.
1단계: 직접 확인할 수 없는 현재 상태들을 나열하고 각각의 확률을 추정해 보세요. (예: 온라인 강의가 내 수준에 맞을 확률 70%, 너무 어려울 확률 20%, 너무 쉬울 확률 10%)
2단계: 각 상태가 어떤 미래 결과로 이어질지 예측해 보세요. (예: 수준이 맞으면 → 3개월 후 실력 향상 90%, 맞지 않으면 → 중도 포기 60%)
3단계: 각 결과에 대한 당신만의 효용 점수를 매기고 기대효용을 계산해 보세요. 가장 좋은 결과를 +100, 가장 나쁜 결과를 -100으로 놓고, 나머지를 그 사이에 상대적으로 배치하면 돼요. 정확한 숫자보다 '실패가 성공보다 몇 배나 아픈가' 같은 상대적 크기가 더 중요해요! (예: 실력 향상 +80점, 돈만 날림 -30점)
보너스: 친구나 가족과 비교해 보면, 얼마나 관점이 다른 지도 알 수 있어요!
예를 들어 '이 온라인 강의를 수강할까?' 고민하고 있다면, 수강료 10만 원이 나에게 얼마나 부담되는지, 실력이 늘었을 때의 기쁨은 얼마나 큰지를 점수로 표현해 보세요. 그럼 나만의 기대효용을 계산할 수 있을 거예요!
오늘 결정 하나를 앞두고 있다면, '확률이 몇이냐'에서 한 발 더 나아가 '그 결과가 나에게 어떤 의미냐'까지 생각해 보세요. 같은 선택지도 사람마다 정답이 다를 수 있으니까요. 저는 이지은이었습니다.
[♪ 밝은 음악]
참고문헌
1. von Neumann, J., & Morgenstern, O. (1944/2007). Theory of games and economic behavior (60th Anniversary ed.). Princeton University Press.
2. Savage, L. J. (1954). The foundations of statistics. John Wiley & Sons.
3. Berger, J. O. (1985). Statistical decision theory and Bayesian analysis (2nd ed.). Springer.