지난 편의 후속인 '베이즈 정리'를 잠시 멈추고 요즘 핫한 주식시장(Market)의 확률을 바라볼까 합니다. 저도 많은 공부를 통해 여러분들에게 더 쉽고 정교하게 다가가려 하는데, 아직 100% 완료가 되지 않았고, 제가 만족할 수준이 되지 못했다고 판단했기 때문입니다. 대신 제가 요즘 많이 정리한 통계학의 꽃이자, 주식 시장을 이해하는 가장 기본이 되는 지도, 바로 '정규분포(Normal Distribution)'를 먼저 소개하고자 합니다. 우연히도 원래 시리즈 초반부터 오늘 기고하기호 정해진 주제이기도 합니다.
많은 분이 "정규분포? 그 종 모양 그래프?" 하고 고개를 끄덕이다가도, 그 밑에 깔린 복잡한 수식을 보는 순간 뒤로 가기를 누르십니다. 하지만 걱정 마세요. 오늘 우리는 그 수식을 외우지 않습니다. 대신 그 수식이 도대체 무슨 말을 하고 싶어 하는지, 그리고 이것이 왜 내 주식 계좌의 운명과 연결되어 있는지 파헤쳐 볼 것입니다.
상상을 한번 해봅시다. 여러분이 하얀 모래를 한 줌 쥐고 바닥의 한 지점을 향해 천천히 떨어뜨립니다. 모래알들은 처음에는 목표 지점에 정확히 떨어지다가, 점차 옆으로 튀기도 하고 쌓이기도 하면서 하나의 작은 언덕을 만들겠죠.
이 모래 언덕의 모양, 어떠신가요? 가운데는 볼록하게 높이 솟아 있고, 양옆으로 갈수록 완만하게 낮아지는 좌우 대칭의 모양. 마치 서양의 종(Bell)처럼 생겼다고 해서 우리는 이것을 '종 모양 곡선(Bell Curve)'이라고 부릅니다.
놀랍게도 이 세상의 수많은 자연 현상이 이 모양을 따릅니다.
대한민국 성인 남성의 키 분포
수능 시험 점수의 분포
공장에서 생산된 과자 봉지의 무게 오차
그리고, 주식 시장의 일일 수익률 분포(이론적으로는 요!)
평균(가운데,)에 대부분의 데이터가 몰려 있고, 평균에서 멀어질수록(아주 키가 크거나, 아주 키가 작거나) 그 수는 급격히 줄어드는 이 패턴. 이것이 바로 정규분포입니다. 통계학자들은 이 분포가 너무나 자연스럽고 보편적이라서 'Normal(정상적인)'이라는 이름을 붙였습니다.
자, 이제 많은 분이 통계책을 덮게 만드는 그 '공포의 수식'을 꺼내 보겠습니다. 심호흡 한번 하세요. 이 종 모양 곡선을 수학적으로 그려내는 함수, 즉 확률밀도함수(PDF)는 이렇게 생겼습니다. 실제로는 평균(μ)이 0이고 표준편차(σ)가 1인 표준정규분포(standard normal distribution)가 자주 사용됩니다.
"으악! 루트에 파이(π)에, 저 e는 또 뭐야?"
진정하세요. 이 식을 보고 도망가지 않으셔도 됩니다. 우리가 맛있는 라면을 끓이기 위해 수프의 화학 공식을 외울 필요는 없잖아요? 이 복잡해 보이는 식은 사실 '종 모양을 예쁘게 그리기 위한 조리법'일뿐입니다.
가장 중요한 주인공은 딱 두 명입니다.
μ (뮤, 평균): 그래프의 위치를 결정합니다. μ가 커지면 종 모양이 오른쪽으로 이동합니다. (주식으로 치면 기대 수익률이 높아지는 것이죠.)
σ (시그마, 표준편차): 그래프의 모양(뚱뚱함)을 결정합니다. σ가 크면 종이 옆으로 퍼져서 펑퍼짐해지고(데이터가 들쑥날쑥함), 작으면 뾰족하고 날씬해집니다.
Fat Tail은 금융이론에 자주 등장하는 고급용어인데, 우리 독자님들은 벌써 고급 수준에 올라와 있습니다. 또 다른 하나의 유사한 개념이 블랙스완 (Black Swan, 검정백조)입니다. 그 특징은
예측 불가능성: 블랙스완 사건은 일반적으로 예상하지 못한 사건으로, 그 발생 가능성이 매우 낮습니다.
큰 영향력: 이러한 사건이 발생하면 사회, 경제, 정치 등 여러 분야에 중대한 영향을 미칩니다.
사후 설명 가능성: 사건이 발생한 후에는 사람들이 이를 예측할 수 있었던 이유를 설명할 수 있지만, 실제로는 예측하기 매우 어려운 경우가 많습니다.
2008년 금융위기: 많은 전문가들이 예측하지 못했던 사건으로, 금융 시스템에 큰 충격을 주었습니다.
COVID-19 팬데믹: 전 세계적으로 큰 영향을 미친 사건으로, 예측하기 어려웠던 상황입니다.
여러분들을 금융학 석사로 임명하는 바입니다.
이제 석사 수준에 걸맞게 이 식들을 단순히 외우려 들지 말고, 이해하여해 봅시다.
"평균(중심) 일 때 확률이 가장 높고, 거기서 멀어질수록 확률은 급격히 떨어진다."
사실 이 식에서 어떤 부속이 그 역학을 할까 짜지 궁금하다면
정규분포의 공식 유도 - 공돌이의 수학정리노트 (Angelo's Math Notes)
여러분들을 모두 박사 수준으로 실력을 향상하는 것이 저의 의도가 아니고, 항상 상식과 교양 수준을 갖조하는 저에게는 호기심은 개인들이 연구할 몫으로 남깁니다.
이제 본론입니다. 우리는 왜 이토록 정규분포에 집착할까요? 바로 '예측'을 하고 싶기 때문입니다.
만약 주식 시장의 수익률이 완벽하게 정규분포를 따른다면, 우리는 '68-95-99.7 규칙'이라는 마법을 쓸 수 있습니다.
평균 ± 2 표준편차(2σ) 범위 안에: 데이터의 95%가 들어옵니다.
주가가 노란색 범위에서 움직일 확률은 주가가 오르는 날 34.1%, 내리는 날 34.1%로 68.2%입니다. 그리고 주가 수익률의 움직임은 표준편차(SD)가 1% 라면, 표준편차의 평균-0, 표준편차가 1%이므로, 99.7% 범위에 들어갈 확률은 평균 plus_minus 2SD
평균이상(A)= 평균(0) +(34.1+13.6+2.1)% = 49.8%
평균이하(ㅠ)= 평균(0) -(34.1+13.6+2.1)% = -49.8%
전체는 49.8-(-49.8) =99.7%이 됩니다.
그래서 하루에 주가가 3%가 이내에서 움직일 확률은 3%, 이를 벗어날 확률은 0.3%가 됩니다.
거의 일어나지 않을 일이라는 겁니다."
이 논리가 바로 금융권에서 쓰는 VaR(리스크 관리 지표)의 핵심입니다. 수학적으로 위험을 통제할 수 있다고 믿는 것이죠.
하지만, 여기에 치명적인 함정이 있습니다.
만약 주식 시장이 교과서적인 정규분포를 따른다면, 2008년 금융위기나 코로나 팬데믹 같은 대폭락장은 수학적으로 '우주가 몇 번 다시 태어나도 일어나기 힘든 확률'이어야 합니다. 하지만 현실은 어떤가요? 우리는 "100년 만의 위기"를 10년에 한 번씩 겪습니다.
왜 그럴까요? 현실의 주식 시장은 정규분포보다 '꼬리'가 더 두껍기 때문입니다. 이를 '팻 테일(Fat Tail)' 현상이라고 합니다.
정규분포 그래프의 양쪽 끝(꼬리)은 바닥에 거의 붙어 있어서 0에 가깝습니다. 하지만 인간의 탐욕과 공포가 지배하는 시장에서는 '쏠림 현상'이 발생합니다. 남들이 팔 때 공포에 질려 같이 투매하고, 살 때 흥분해서 같이 사는 것이죠.
이로 인해 그래프의 꼬리 부분이 위로 들려 올라가며 두툼해집니다. 정규분포상으로는 0.00001%여야 할 대폭락(블랙 스완)이 현실에서는 1%, 2%의 확률로 불쑥 튀어나옵니다.
따라서 "정규분포는 신의 영역"이라는 말은 반은 맞고 반은 틀립니다. 자연계(키, 몸무게)에서는 완벽하게 들어맞지만, 돈이 오가는 금융 시장에서는 신의 흉내를 내는 '불완전한 지도'일뿐입니다.
"현실이랑 안 맞는다면서 왜 배워야 해요?"
지도가 실제 지형과 100% 똑같지 않다고 해서 지도를 버릴 수는 없으니까요. 정규분포는 완벽하지는 않지만, 우리가 가진 가장 강력한 '기준점(Benchmark)'입니다.
기준 잡기: 정규분포를 알아야 지금 시장이 '정상'인지 '비정상(과열/패닉)'인지 판단할 수 있습니다. 3 시그마를 벗어난 움직임이 보인다면? "아, 지금은 통계적 범위를 벗어난 특이 상황(광기)이구나. 조심해야겠다"라고 경고등을 켤 수 있죠.
리스크 시각화: 수익률만 보는 초보에서, 변동성(σ)이라는 리스크의 넓이를 함께 보는 고수로 거듭날 수 있습니다.
지난 시간 베이즈 정리 (다음 시간에 다시 2편으로 찾아올게요)로 내 생각을 유연하게 바꾸는 법을 배웠고, 오늘 정규분포를 통해 시장의 확률적 분포를 배웠습니다.
통계학은 미래를 100% 맞히는 수정구슬이 아닙니다. 대신 '어둠 속에서 손전등을 비추는 도구'입니다. 손전등이 비추지 못하는 사각지대(팻 테일)가 있음을 인정하면서, 빛이 닿는 범위 내에서 최선의 의사결정을 내리는 것. 그것이 통계학을 공부하는 진짜 이유가 아닐까요?
다음 시간에는 이 정규분포 지식을 무기 삼아, "도대체 여론조사는 몇 명을 조사해야 믿을 수 있는 거야?" 그리고 "증권사 목표 주가는 어떻게 나오는 거야?"라는 의문을 해결해 줄 '표본과 모평균의 추정' 이야기로 돌아오겠습니다. (선거철마다 듣는 '신뢰 수준 95%'의 비밀, 이제 밝혀드립니다!)
오늘도 통계학을 포기하지 않은 여러분에게 박수를 보냅니다!
요즘 새로운 미션준비 등 새벽 5시부터 공부를 시작하는데 눈이 많이 피곤합니다. 그래서 오늘 오후는 인근의 남산이라도 가서 눈에게 초록빛 자연을 보여주면서 2025년 고생한 저를 위로할까 합니다. 여러분들도 한 해를 정리하는 시간을 가지시길 바랍니다.