brunch

3강. 조건부 확률과 베이즈 정리

확률로 돈을 번다

by 골드펜

저는 주식 투자에서 조금이라도 더 나은 수익을 얻을 방법은 없을까 고민하다가, 자연스럽게 확률과 통계에 관심을 갖게 되었습니다.
이 글은 제가 공부하면서 얻은 깨달음과 지식을 정리하고, 이를 함께 나누기 위해 쓴 것입니다.

혹시 제 글에 오류가 있거나 과장된 부분이 있다면, 언제든 지적해 주시길 바랍니다. 그런 피드백은 제 글의 신뢰도를 높이는 데 큰 도움이 될 것이며, 저는 기꺼이 배움의 기회로 삼겠습니다.




일상 속 확률의 비밀: 조건부 확률과 베이즈 정리

이름은 어렵지만, 이 두 가지 확률 개념은 우리가 매일 무언가를 결정할 때 사용하는 아주 기본적인 생각의 틀이다. 복잡한 수학 공식은 잊고, 이 개념들이 우리의 판단을 어떻게 돕는지 쉽게 이해해 보자.


1. 조건부 확률: '조건'이 붙으면 세상이 달라진다!

조건부 확률 (Conditional Probability)은 쉽게 말해 "만약에 어떤 조건이 정해졌다면, 확률은 어떻게 될까?"를 계산하는 것이다.


핵심 질문: "조건이 붙으면 확률이 바뀌나요?"

상황: 주머니에 빨간 공 10개, 파란 공 10개가 있다.

단순 확률 (조건 없음): 공을 하나 뽑을 때, 빨간 공일 확률은 50%이다.

조건부 확률 (조건 있음): 첫 공 하나를 뽑았더니 파란 공이다. 이 공은 다시 넣지 않는다. 이제 남은 공 19개 중 빨간 공 10개, 파란 공 9개이다. 공 하나를 뽑았을 떼, 빨간 공일 확률은?

결과: 두 번째 공이 빨간 공일 확률은 10/19≈ 52.6%로, 원래 50%에서 바뀌었다.


이처럼, 하나의 조건이 발생하는 순간, 다음 사건에 대한 우리의 확률 예측은 바뀐다. 이것이 조건부 확률이다.


또 다른 예를 들어보자.

대부분의 개인 투자자는 시장 전체의 단순 확률에 매몰된다. 예를 들어, 코스피 시장 전체가 하루 동안 오를 확률은 50%를 살짝 웃도는 수준일 꺼다. 이 '조건 없는' 확률만 가지고는 어떤 전략도 세울 수 없다. 동전 던지기와 다를 바 없으니까. 여기에 '조건'이라는 필터를 씌우는 순간, 세상은 달라진다.


단순 확률: 내일 A종목이 오를 확률은 55%.

조건부 확률: "전날 외국인 순매수가 3일 연속 조건"을 만족했을 때, 내일 A종목이 오를 확률은 70%다.(실재 수치는 아닙니다)

55%와 70%의 차이, 바로 이것이 조건부 확률이 만들어내는 '확률적 우위(Edge)'다. 성공적인 트레이딩 전략이란, 시장의 '조건'들을 분석하여 나에게 유리한 확률(70% 같은)이 발생하는 지점을 찾아내고, 그 조건이 충족될 때만 베팅하는 행위다.


사례를 하나 더 공부해 보자.

"약을 먹으면 나을 확률은 얼마일까?"

P(회복∣약) -> 약이라는 조건 하에서 회복을 계산한다.


이 확률은 다음과 같이 해석된다.

전체 세상: 감기에 걸린 모든 사람

조건: 이들 중 감기약을 먹은 사람

확률 계산: 약을 먹은 사람들 중에서 실제로 감기가 나은 사람

이 수치(P(회복∣약))가 만약 0%라면, "약을 먹는 조건 하에서는 80%의 확률로 회복한다"는 의미가 된다. 이 확률은 약의 효과를 측정하는 데 사용된다.


뒤에 나오는 베이즈 정리는 이 상황에 대해 거꾸로 의문을 가지면서 출발한다. 내가 감기가 걸려서 약을 먹고 나았다. 감기약의 효과인지, 나을때가 되어서 나았는지 궁금하다. 감기약이 과연 내 감기를 낫게 하는데 얼마나 효과가 있었을까?


P(회복∣약)이 P(약∣회복)이 된다.



2. 베이즈 정리: 새로운 정보를 통해 '믿음'을 갱신하는 방법

베이즈 정리 (Bayes' Theorem)는 조건부 확률을 활용하여 "새로운 정보(증거)가 들어왔을 때, 기존에 가지고 있던 믿음(확률)을 얼마나 합리적으로 바꿔야 하는지"를 알려주는 규칙이다. 이것은 우리가 정보를 받아들이고 판단하는 방식을 체계화한 것이다.


핵심 질문: "새로운 증거를 얼마나 믿어야 할까?"

베이즈 정리는 우리의 판단 과정을 세 단계로 나눈다.


예시: 독감 예측

1. 원래 믿음 (사전 확률)

새로운 정보가 들어오기 전, 내가 가진 기본 확률.

독감이 유행하기 전, 내가 독감에 걸릴 확률은 5%라고 가정하자.


2. 새로운 증거

새롭게 관찰한 정보나 증거.

갑자기 열이 나기 시작했다. (이것이 새로운 증거 B)


3. 갱신된 믿음 (사후 확률)

이 증거를 반영하여 새로 계산된 확률.

과거 데이터로 보니, '실제 독감에 걸린 사람이 열이 날 확률'이 '독감이 아닌 사람이 열이 날 확률'보다 10배 높았다. (정보의 가치 = 10배)


결과

열이 난다는 증거를 본 후, 내가 실제로 독감에 걸렸을 확률은 5%에서 훨씬 높아진 합리적인 값으로 갱신된다.


베이즈 정리는 우리가 감정이나 직감 대신, 증거의 실제 가치를 따져서 가장 합리적인 판단을 내리도록 돕는 도구다. 뉴스나 소문을 들었을 때 "과연 이 정보가 내 원래 생각을 얼마나 바꿔야 타당할까?"를 묻는 것이 바로 베이즈 정리의 정신이다.


사례를 하나 더 들어보자.

원래 믿음 (사전 확률): 뉴스를 보기 전, 내가 분석한 내일 주가 상승 확률 (예: 60%)

새로운 정보 (증거): 오늘 밤 발표된 깜짝 실적 발표라는 뉴스.

정보의 가치 : 이 깜짝 실적이 실제로 주가가 오르는 날에, 주가가 내리는 날보다 2배 더 자주 관측된다는 과거 데이터. 즉, 이 정보는 '2배의 가치'를 갖는다.

갱신된 믿음 (사후 확률): 원래 60%이던 상승 믿음에 2배의 가치를 반영하여, 상승 확률을 75% 등으로 합리적으로 올린다.


앞서 사례로 든 감기약에 대한 베이즈 정리적 사고로 보면.


질문: 감기약을 먹고 나았는데, 정말로 약 때문일까? 아니면 그냥 운 좋게 나을 때가 된 걸까?


1. 전제 조건 (과거 데이터)

우리가 가진 믿음을 갱신하기 위해, 과거 데이터를 기반으로 몇 가지 숫자를 가정해 보자. (약간의 과장된 숫자로 이해를 돕습니다.)


원래 믿음 (P(약효)): 약을 먹기 전, 이 약이 실제로 효과가 있을 거라고 믿는 확률 (사전 확률) = 50%

약이 효과가 있을 때 회복될 확률 (P(회복∣약효)): 약이 진짜 효과가 있다면 감기가 나을 확률 = 90%

약이 효과가 없을 때 회복될 확률 (P(회복∣약효c)): 약이 아무 효과가 없어도 (가만히 있어도) 감기가 나을 확률 (자연 회복력) = 30%


100명이라고 가정하고 계산을 해보겠습니다. 약을 먹고 나은 경우는 35명, 약을 먹지 않고 나은 경우는 15명. 나은 60명 중에서 약을 먹고 나은 경우가 45명이므로, 약에 대한 믿음의 확률이 75%로 갱신되었다.


감기 약을 먹었다 -> 나았다라는 연역적 사고가 조건부 확률이다.

나았는데 그게 과연 감기약 때문이었을까? 라는 귀납적 사고가 베이즈 정리이다.



나스닥과 코스피200

나스닥과 코스피200 선물이 상승과 하락이 다음날에 얼마나 영향을 미칠까 궁금해졌다.


2000년 이후 데이터를 바탕으로 계산을 해봤다.

전날 지수가 상승했다면 1, 하락했다면 0.

당일 지수가 상승했다면 1, 하락했다면 0.


나스닥
전체 상승 확률: 54.4%

전날 하락 시 다음 날 상승 확률: 55.7%

나스닥 상하.png



코스피200
전체 상승 확률: 53.2%

전날 하락 시 다음 날 상승 확률: 53.7%

코스피 상하.png


약간의 차이는 보였지만, 이 차이로 투자의 방향을 바꾸기는 애매해 보인다.


그럼 다양한 방법을 시도해 볼수 있을듯하다.

연속상승과 연속하락, 최근 5일 변동성보다 클때와 작을때, 5일 이평선 위일때와 아래일때. 이런 조건들로 계산을 해볼수 있다.

만일 특정한 조건이 수익율을 높여 주었다고 해도 곧바로 실행에 옮기기에는 부담스럽다. 이 방법이 과연 정말 의미가 있을까? 우연은 아닐까? 이런 고민도 확률과 통계를 통해 검증할수 있다.


핵심 정리

조건부 확률: 조건이 붙으면 확률은 달라진다.
베이즈 정리: 새로운 정보가 들어오면 확률을 갱신한다.

조건의 방향: P(B|A)와 P(A|B)는 다른 개념이다.
실전 투자: 조건 하나로 시장을 설명하기는 어렵다. 의미 있는 전략을 만들려면 조건들을 정교하게 조합하고, 충분한 데이터로 검증해야 한다.


keyword
목요일 연재
이전 03화2강. 합의 확률과 곱의 확률