불확실성을 줄이는 정보의 가치
[♪ 밝은 음악]
이지은: 안녕하세요, '안개 속을 걷다'의 이지은입니다! 오늘도 불확실성과 친해지는 시간, 함께해요!
어제 친구가 중고 명품 가방을 사려고 하는데 저한테 조언을 구하더라고요. "전문가한테 5만 원 주고 감정받을까, 아니면 그냥 살까?" 하고요. 개인 직거래로 나온 매물이라 플랫폼 감정이 없었대요. 그래서 제가 물었어요. "그 가방 얼마짜리인데?" "200만 원이야." "음... 그럼 감정받는 게 나을 것 같은데?"
그랬더니 친구가 이렇게 말하는 거예요. "근데 감정받아도 100% 확실한 건 아니잖아. 그럼 5만 원이 아까운 거 아니야?"
[띠링!]
우리는 늘 이런 고민을 하죠. 병원에서 추가 검사를 받을까 말까, 부동산 매물을 더 알아볼까 말까, 여행지 정보를 더 찾아볼까 말까...
정보를 얻는 데는 시간과 돈이 들어요. 그런데 그 정보가 정말 결정을 바꿀 만큼 가치가 있을까요? 오늘은 '정보의 가치'라는 개념을 통해 이 질문에 답해볼게요.
자, 그럼 시작해 볼까요?
우리는 자각하지 못하는 사이에도 끊임없이 선택을 내리며 살아갑니다. 아침에 몇 시에 일어날지, 점심에 무엇을 먹을지, 어떤 교통편으로 출근할지. 우산을 챙길지, 이 제품을 지금 살지, OTT 구독을 유지할지, 친구 생일에 무엇을 선물할지, 건강검진을 받을지. 이 프로젝트를 맡을지, 이직을 할지. 어느 대학에 지원할지, 어떤 전공을 택할지, 이 사람과 결혼할지, 지금 이사를 할지.
이런 선택의 순간마다, 겉으로 잘 드러나지 않는 또 하나의 결정이 숨어 있습니다. '지금 가진 정보로 바로 결정할까, 아니면 시간과 돈을 들여 더 알아본 뒤에 결정할까?' 이 또한 결정이니, 지난 시간 배운 베이지안 의사결정 프레임워크—믿음, 예측, 가치, 비교의 네 단계—를 그대로 적용할 수 있습니다.
그러면 두 선택지 중 어느 쪽이 나을지 어떻게 따져볼 수 있을까요? 이때 쓰이는 개념이 정보의 가치(Value of Information, VOI)입니다. VOI는 정보 수집 덕분에 얻게 되는 기대효용의 개선분으로 정의됩니다[1,2]. 즉, 정보가 있을 때 내릴 수 있는 최선의 결정과 정보 없이 내리는 최선의 결정, 이 둘의 기대효용 차이죠. 이 VOI가 정보 수집 비용보다 크다면, 정보를 수집하는 것이 합리적입니다.
200만 원짜리 중고 명품 가방을 사려는 상황을 분석해 봅시다.
1단계: 믿음 (현재 상황 파악). 데이터(제품 설명, 제품 사진, 판매자의 판매 이력 등)를 바탕으로 제품 상태에 대한 현재의 믿음을 적어봅니다. 판매자가 아주 낯설거나, 제품 가격이 시세보다 현저히 싸다면 이 단계에서부터 진품 확률을 낮게 잡아야겠죠. 여기서는 진품일 확률 60%, 가품일 확률 40%로 정하겠습니다.
2단계: 예측 (각 선택의 결과). 이제 각 선택지를 택했을 때, 예상되는 결과를 살펴봅니다.
먼저 추가 감정 없이 결정하는 경우(선택지 1)를 생각해 보세요. 이 경우 현재 믿음만으로 구매 여부를 결정해야 합니다. 다만 이 구매 여부 결정은 지금 당장이 아니라, 선택지 1을 택한 미래의 자신이 내리게 되는 것이죠. 구매 포기를 택하면 아무 일도 일어나지 않고, 구매 쪽만 예측 분포가 필요합니다.
구매 결과가 곧 데이터입니다. 구매 행위 자체는 제품의 진위에 영향을 주지 않으므로, 데이터 모델은 단순합니다.
이 데이터 모델과 현재 믿음을 결합하면, 구매 시 진품 구매 확률은 60%, 가품 구매 확률은 40%입니다. 1단계에서 설정한 가설 확률 분포와 수치가 같은데, 이는 데이터 모델이 단순해서 생기는 우연한 일치입니다. 뒤에 살펴볼 선택지 2도 구매 결과를 예측할 때는 여기와 같은 단순 모델을 씁니다. 다만 그전에 감정이라는 단계가 끼어 있고, 감정 결과를 예측하는 데이터 모델에서는 판정이 100% 정확한 것은 아니기 때문에 그 시점에서는 이 수치 일치가 깨집니다.
이번에는 전문가 감정을 받는 경우(선택지 2)입니다. 5만 원을 내고 90% 정확도의 감정을 받는다고 해봅시다. 여기서 90% 정확도란 진품을 '진품'으로, 가품을 '가품'으로 정확히 판정할 확률이 90%라는 뜻입니다. 10%는 틀릴 수 있죠. 실제 감정에서는 두 오류율이 다르지만(대개 정교한 가품을 잡아내는 쪽이 더 어렵습니다), 여기서는 설명을 단순화하기 위해 양쪽 모두 90%로 두겠습니다.
'진품' 판정이 나오는 경우는 두 가지입니다. 실제 진품을 '진품'으로 올바르게 판정하는 경우와, 실제 가품을 '진품'으로 잘못 판정하는 경우죠. 전체 확률의 법칙을 사용하면, P('진품' 판정) = P(진품)×P('진품' 판정|진품) + P(가품)×P('진품' 판정|가품) = 60%×90% + 40%×10% = 58%입니다. 따라서 '가품' 판정이 나올 확률은 100% - 58% = 42%입니다.
실제 감정을 받아보진 않았지만, 현재 제품 상태에 대한 믿음으로 감정 결과를 예측해 본 것입니다.
먼저 '진품' 판정이 나온 경우를 생각해 보죠. 앞서 감정 결과를 예측할 때는 조건부 확률을 순방향으로 사용했습니다. 이번에는 감정 결과를 관찰한 후 제품 상태에 대한 믿음을 업데이트하는 역방향이므로, 같은 값을 데이터 지지도로 읽습니다. '진품' 판정이라는 데이터가 두 가설을 각각 얼마나 지지하는지 보면, 진품 가설은 90점, 가품 가설은 10점입니다. 베이즈 정리에 따르면, P(진품|'진품' 판정) = (90점 × 60%) / (90점 × 60% + 10점 × 40%) = 54 / 58 = 93.1%입니다. 따라서 P(가품|'진품' 판정) = 6.9%입니다. 같은 절차를 '가품' 판정 케이스에도 동일하게 적용해 아래 표에 함께 정리했습니다.
전문가 감정의 정확도가 90%이므로, 감정 결과는 우리의 믿음을 크게 바꿔줍니다. 원래 60%였던 진품 확률이 '진품' 판정 후에는 93.1%로 올라가고, '가품' 판정 후에는 14.3%로 떨어지는 것이죠. 만약 이어서 구매를 결정한다면, 선택지 1에서 본 단순 데이터 모델을 다시 적용해 구매 결과의 예측 분포도 구할 수 있습니다. 이때도 데이터 모델이 단순하므로 예측 분포는 판정 후 믿음과 수치가 같게 나옵니다.
여기서 잠깐, 이 문제가 지난 시간에 다룬 미용실 변경보다 조금 더 복잡하다는 것을 눈치채셨나요? 미용실 변경은 '바꾼다/안 바꾼다'를 결정하면 끝이지만, 여기서는 '감정을 받는다'고 결정해도 그 결과에 따라 또다시 '산다/안 산다'를 결정해야 합니다. 마치 갈림길에서 또 다른 갈림길을 만나는 것처럼 말이죠.
이런 순차적 의사결정에서는 미래의 자신이 각 상황에서 최선의 선택을 할 것이라고 가정합니다[3,4]. 즉, '진품' 판정을 받으면 구매할지 말지, '가품' 판정을 받으면 구매할지 말지를 미리 계산해 두는 것이죠. 물론 미래의 내가 지금처럼 냉정하게 판단하리라는 보장은 없습니다. 이것은 '자기 통제'라는 별개의 주제이고, 여기서는 합리성이 유지된다고 가정하고 분석을 이어가겠습니다.
3단계: 가치 (효용 평가). 각 결과의 가치를 다음과 같이 설정해 봅시다:
진품 구매 (가치 250만 원, 구매 비용 200만 원): +50만 원
가품 구매 (가치 0원, 구매 비용 200만 원): -200만 원
구매 포기: 0원
감정 비용 5만 원은 각 결과의 효용에 합산하지 않고, 선택지 2 전체의 비용으로 마지막 비교 단계에서 따로 다룹니다.
4단계: 비교 (기대효용 계산). 이제 각 선택지의 기대효용을 계산하고 비교해 봅니다.
먼저 선택지 1(추가 감정 없이 결정)의 경우:
현재 믿음으로는 구매의 기대효용이 -50만 원이므로, 구매하지 않는 것(0원)이 최선입니다. 따라서 선택지 1의 기대효용은 0원입니다.
이제 선택지 2(전문가 감정 후 결정)의 경우를 살펴봅시다. 두 판정 결과 각각에 대해 기대효용을 계산한 뒤 가중평균하면 됩니다.
'진품' 판정을 받으면 구매(+32.8만 원)가 포기(0만 원) 보다 유리하고, '가품' 판정을 받으면 포기(0만 원)가 구매(-164.3만 원) 보다 훨씬 유리합니다.
이를 종합하면 선택지 2의 기대효용은 두 판정 확률로 가중평균한 값이 됩니다. 58% ('진품' 판정 확률) × (+32.8만 원) + 42% ('가품' 판정 확률) × (0만 원) = +19만 원입니다.
지금까지의 두 선택지 분석을 하나의 결정 트리로 모아보면 다음과 같습니다.
그림 1. 감정 의사결정의 결정 트리. 붉은 원(결정 노드)은 우리가 고르는 분기, 파란 네모(우연 노드)는 확률로 정해지는 분기입니다. 녹색으로 표시된 기대효용은 각 분기에서 계산된 값이며, 선택 분기에서는 기대효용이 높은 쪽을 고른다고 가정합니다. 수치 단위는 만원.
이 19만 원이 감정이 가져다준 기대효용 개선분, 즉 엄밀한 의미의 정보의 가치(VOI)입니다. 여기서 감정 비용 5만 원을 빼면 14만 원의 순이익이 남는데, 이를 순 정보가치(Net VOI)라고 부릅니다. 대중적으로는 Net VOI가 더 직관적이지만, VOI와 비용을 분리해 계산하는 것이 다른 의사결정 문제로 확장할 때 훨씬 유용합니다.
만약 감정이 100% 정확했다면 어떨까요? 선택지 2와 같은 절차를 그대로 따라가되, 감정 데이터 모델만 바뀝니다. 판정 예측 확률은 가설 확률과 같아져 '진품' 판정 60%, '가품' 판정 40%. 베이지안 업데이트를 하면 각 판정 후 가설이 확정되죠 ('진품' 판정 후 진품 100%, '가품' 판정 후 가품 100%). 최선의 선택도 명확합니다. '진품' 판정 후 구매하면 확실히 진품이라 +50만 원, '가품' 판정 후에는 구매하면 확실히 -200만 원이 되므로 포기(0만 원)가 낫습니다. 가중평균하면 60% × (+50만 원) + 40% × (0만 원) = 30만 원까지 올라갑니다. 이것을 완전정보의 가치(Expected Value of Perfect Information, EVPI)라고 부릅니다. 90% 정확도 감정의 가치(19만 원)는 이 상한(30만 원)의 약 63% 수준인 셈이죠. EVPI는 '아무리 좋은 감정이라도 30만 원 이상의 값어치는 없다'는 판단 기준을 제공합니다.
감정이 100% 정확하지 않음에도 의사결정을 개선하는 효과가 비용을 훨씬 초과합니다. 이것이 베이지안 프레임워크가 보여주는 통찰입니다. 불완전한 정보라도 의사결정을 개선할 수 있다면 충분한 가치가 있다는 것이죠.
일상에서도 이런 계산을 암묵적으로 하고 있습니다. 건강검진에서 이상 수치가 나왔을 때를 생각해 보세요. 추가 검사 없이 경과를 관찰할 수도 있고, 정밀검사를 받을 수도 있습니다. 이때 계산에 넣어야 할 파장은 한쪽만이 아닙니다. '병을 놓쳤을 때의 피해'뿐 아니라 '멀쩡한데 검사받아서 생기는 피해'—불필요한 후속 검사, 합병증, 불안, 과잉치료—도 함께 봐야 합니다. 초기 확률이 애매한 구간에서 두 파장이 모두 클 때 정보의 가치가 가장 커지고, 어느 한쪽으로 확실히 기울어 있다면 검사의 가치는 줄어듭니다.
한편 만족스러운 일자리 제안을 받았을 때는 어떨까요? 즉시 수락할 수도 있고, 다른 회사 면접을 더 보고 결정할 수도 있습니다. 하지만 현재 제안이 이미 충분히 좋다면 이야기가 달라집니다. 추가 면접으로 얻을 기대 개선분이, 그 사이 제안이 철회될 위험이나 시간 비용을 넘지 못할 수 있죠.
온라인 쇼핑에서 리뷰를 읽는 것도 비슷한 의사결정입니다. 처음 몇 개의 리뷰는 불확실성을 크게 줄이지만, 10개 이상부터는 비슷한 내용이 반복되어 시간 투자의 가치가 급감합니다. 더 읽어도 결정이 바뀔 가능성이 낮다면, 그만 읽고 결정하는 것이 현명하죠.
이처럼 추가 정보의 가치가 그 비용을 넘지 않는 시점, 즉 '이제 충분히 알았다'고 멈출 때를 아는 것이 중요합니다. 이런 순차적 탐색 상황에는 수학적으로 증명된 최적 전략이 있습니다. 예를 들어 10명의 비서직 지원자를 순차적으로 면접 본다면, 처음 3명은 기준을 잡기 위해 관찰만 하고, 그 이후부터는 지금까지 본 사람보다 나은 지원자가 나타나면 즉시 채용하는 것이 최적입니다[5]. 지원자 수가 많아질수록 '처음에 건너뛸 비율'은 약 37%(수학적으로는 자연상수 e ≈ 2.72의 역수, 즉 1/e ≈ 0.37)에 수렴하는데, 그래서 이를 '37% 규칙'이라고 부릅니다.
37% 규칙은 최적 중단 이론(optimal stopping theory)의 한 예입니다. 이 37%라는 숫자에는 또 다른 의미도 있습니다. 최적 전략을 충실히 따랐을 때 '진짜 최고의 후보'를 뽑을 확률도, 마찬가지로 지원자 수가 많아질수록 약 37%에 수렴합니다. 무작위 선택(10명 중 1명이면 10%)보다는 훨씬 낫지만, 나머지 63%의 경우에는 차선 혹은 그 이하를 선택하게 된다는 뜻이죠. 최적 전략조차 완벽을 보장하지 않는다는 사실은 기억해 둘 만합니다.
엄밀히 말하면 이 규칙이 최대화하는 것은 '최고의 후보를 뽑을 확률' 그 자체입니다. 목적을 바꾸면—예컨대 '최고'보다 '상위권이면 만족'으로 기준을 완화하면—최적 관찰 비율도 달라지고, 대체로 기준이 유연해질수록 탐색 단계를 더 짧게 끝내도 괜찮아집니다. 또한 지원자를 다시 불러올 수도 있고, 정확히 몇 명이 지원할지 모를 수도 있습니다. 하지만 핵심 교훈은 여전히 유효합니다. 탐색과 활용의 균형을 맞추되, 완벽을 추구하다가 좋은 기회를 놓치지 말라는 것입니다.
집 구하기, 배우자 찾기, 직장 구하기 등에서도 이 원리에서 영감을 얻을 수 있습니다[6]. 처음 30-40%는 시장 파악을 위한 탐색 기간으로 삼고, 그 이후부터는 기준을 넘는 선택지가 나타나면 과감히 결정하는 것이죠. 완벽한 선택을 기다리다가 좋은 기회를 놓치는 것보다, 충분히 좋은 선택을 적시에 하는 것이 더 현명할 수 있습니다. 다만 비서 문제는 '최고 한 명을 뽑는 일회성 상황'을 전제로 한 수학 모형이므로, 돌아갈 수 있고 관계가 장기적인 실제 상황에 그대로 대응되진 않습니다. 실제로는 오히려 우리가 탐색을 너무 빨리 끝내는 경우가 더 흔하다는 연구도 있으니, 비유로 받아들이는 정도가 적당합니다.
모든 정보가 똑같이 중요한 것은 아닙니다. 베이지안 프레임워크의 각 요소(믿음, 효용 등)를 조금씩 바꿔보며 최적 결정이 어떻게 달라지는지 살피면, 어떤 불확실성이 결정을 좌우하는지 드러납니다. 이를 민감도 분석이라고 합니다[7]. 명품 감정 예제에서도 진품 확률을 바꿔보면 알 수 있죠. 이 확률이 50%(반반)에 가까울수록 감정의 가치는 커지고, 90%(거의 진품 확신)에 가까울수록 오히려 작아집니다.
창업을 예로 들면, 시장 수요에 대한 믿음이 10%만 바뀌어도 전체 결정이 바뀔 수 있습니다. 이런 경우 시장 조사에 투자하는 것이 가치가 있죠. 반면 사무실 위치에 대한 믿음은 크게 바뀌어도 결정에 영향을 주지 않습니다. 이런 정보는 굳이 더 수집할 필요가 없는 것입니다.
정보의 가치라는 개념으로 우리가 정보 수집에서 빠지기 쉬운 함정들도 명확히 이해할 수 있습니다. 분석 마비(analysis paralysis)에 빠진 사람은 추가 정보의 기대효용이 거의 0에 가까워졌는데도 결정을 미루며 계속 자료를 모읍니다[8]. 이미 충분한 정보를 가지고 있어서 새로운 정보가 결정을 바꾸지 못하는 상황인 거죠. 확증편향적 수집은 더 교묘합니다. 자신의 초기 판단을 지지하는 정보만 골라서 찾기 때문에, 아무리 많은 정보를 모아도 믿음이 크게 바뀌지 않습니다. 수집 자체가 선별적이어서, 모으는 정보가 의사결정 개선에 기여할 여지가 체계적으로 좁아지는 셈이죠. 매몰비용의 오류는 이미 정보 수집에 들인 시간과 노력이 아까워서 계속 정보를 찾는 경우입니다. 하지만 과거의 비용은 미래 의사결정의 효용과 무관하다는 것을 잊어서는 안 됩니다.
이 함정들을 피하려면 결국 멈출 때를 알아야 합니다. 정보 시대에는 역설적으로 '언제 더 찾아볼지'보다 '언제 그만 찾을지'를 아는 것이 더 어려운 기술이 되었습니다. 완벽한 정보는 존재하지 않으며, 대부분의 경우 그럴 필요도 없습니다. 정보 수집의 기대효용이 그 비용을 넘지 않는 시점에서 결정하는 것으로 충분합니다.
이지은: 어떠셨나요? '정보를 더 수집할까 말까'라는 고민도 베이지안 프레임워크로 차근차근 따져볼 수 있다는 게 오늘의 포인트였어요. 아, 참! 아까 그 친구에게는 이렇게 말해줬어요. "5만 원 아깝다고 생각했던 그 감정료, 사실은 19만 원짜리 정보를 5만 원에 사는 거야. 받고 와."
핵심은 이거예요. '정보를 더 수집할까?'도 하나의 의사결정이고, 우리가 배운 네 단계(믿음-예측-가치-비교)로 분석할 수 있다는 것! 모든 정보가 똑같이 가치 있는 건 아니에요. 여러분의 결정을 바꿀 수 있는 정보, 그리고 그 변화가 큰 차이를 만드는 정보에 집중하세요.
그리고 기억하세요. 완벽한 정보를 기다리다가 기회를 놓치는 것보다, 충분히 좋은 정보로 적절한 타이밍에 결정하는 것이 더 현명할 때가 많아요!
[띠링!]
오늘의 미션! 현재 고민 중인 결정이 있다면, 베이지안 프레임워크로 정보의 가치를 평가해 보세요:
1. 믿음: 각 가설의 확률을 정해 보세요.
2. 예측: 정보를 수집하지 않는 경우, 1단계에서 정한 가설 확률과 데이터 모델을 사용해 각 결과의 확률을 예측해 보세요. 정보를 수집하는 경우, 1단계에서 정한 가설 확률을 업데이트하고, 이를 바탕으로 다시 각 결과의 확률을 예측해 보세요.
3. 가치: 각 결과의 효용과 정보 수집 비용을 정해 보세요.
4. 비교: '지금 결정'과 '정보 수집 후 결정'의 기대효용을 계산해 비교해 보세요. 차이가 정보 수집 비용보다 크면 정보를 수집하세요.
예시: '이 온라인 강의를 들을까?'
1. 믿음: 강의가 도움 될 확률 70%
2. 예측: 수강 시 70%로 만족, 30%로 불만족. 후기를 읽어 믿음이 업데이트되면 각 확률도 달라짐.
3. 가치: 만족 +100, 불만족 -50, 후기 읽기 30분 -10
4. 비교: 이 숫자들을 가지고 '후기 없이 바로 결정'과 '후기 읽고 결정'의 기대효용을 각각 계산해서 비교. 차이가 30분(-10)을 넘으면 읽어볼 가치가 있어요.
하지만 '점심 먹으러 어디에 갈까?'를 고민한다면... 식당 리뷰까지 찾아보지 말고 그냥 가까운 곳으로 가세요!
다음 시간에는 개인의 의사결정을 넘어, 여러 사람이 함께 결정을 내릴 때의 이야기로 넘어갑니다. 여럿이 모이면 정말 더 현명해질까요? 다음 편에서 확인해 봐요! 저는 이지은이었습니다.
[♪ 밝은 음악]
참고문헌
1. Raiffa, H., & Schlaifer, R. (1961/2000). Applied statistical decision theory. Wiley.
2. Parmigiani, G., & Inoue, L. (2009). Decision theory: Principles and approaches. Wiley.
3. Puterman, M. L. (2014). Markov decision processes: Discrete stochastic dynamic programming. John Wiley & Sons.
4. Bellman, R. (1957). Dynamic programming. Princeton University Press.
5. Ferguson, T. S. (1989). Who solved the secretary problem? Statistical Science, 4(3), 282–289.
6. Christian, B., & Griffiths, T. (2016). Algorithms to live by: The computer science of human decisions. Henry Holt.
7. Clemen, R. T. (1996). Making hard decisions: An introduction to decision analysis (2nd ed.). Duxbury Press.
8. Russo, J. E., & Schoemaker, P. J. H. (2002). Winning decisions: Getting it right the first time. Currency.