통계적 가설 검정과 베팅 사이즈

Oct 24. 2021

# 베팅의 규모는 결국 확신의 정도

트레이딩과 투자는 종종 포커에 비견되곤 한다. 그 이유는 다른 게임들과 다르게 포커는 베팅의 규모를 결정하는 것이 매우 중요한 게임이기 때문이다. 연속적인 일련의 게임을 진행하고 있는 상황에서는 만약 계속해서 지고 있더라도 단 한 번의 이기는 게임에 크게 걸면 결국은 승리하게 되고, 반대로 계속해서 이기고 있더라도 단 한 번의 지는 게임에 크게 걸면 결국은 패배하게 된다. 그렇기 때문에 베팅의 규모를 적절히 조절하지 못한다면, 아무리 뛰어난 트레이딩 전략 혹은 투자 전략도 결국엔 돈을 잃을 수밖에 없다.

베팅의 사이즈를 결정하는 문제는 이론적으로만 본다면 사실 매우 단순하다. 우리는 어떨 때 크게 베팅하고 어떨 때 작게 베팅하는가? 당연히 그 게임에서 이길 것이라는 생각이 클 때 크게 베팅하고, 이길 것이라는 생각이 작을 때 적게 베팅할 것이다. 다시 말해, 베팅 사이즈라는 것은 게임 승리에 대한 확신의 정도와 정확히 비례한다. 이 확신의 정도가 바로 베팅 사이즈를 결정하는 입력 변수인 것이다. 100% 확률로 이기는 게임이 있다고 한다면 레버리지를 써서라도 있는 돈 없는 돈 털어서 올인을 해야 하고, 100% 확률로 지는 게임이라면 1원 한 푼도 쓰지 말고 무조건 그 게임판에서 뛰쳐나와야 한다.

그렇다면 베팅 규모를 결정함에 있어 이길 것 같다고 느끼는 나의 직감이나 촉 말고 이를 좀 더 계량적으로 접근하는 방법은 없을까? 베팅 사이즈를 결정하는 것은 결국 이기는 것에 대한 불확실성이 반영되어 있는 결과물이다. 그런데 불확실성을 다루는 학문은? 당연히 통계학이다. 여기서 우리는 통계학을 사용해 불확실성의 정도를 측정하고 나아가 그 측정된 불확실성의 정도를 바탕으로 하여 베팅 사이즈를 결정할 수 있는 방법이 없는가에 대해 생각해 보려고 한다.

# 통계적 확신의 정도, t-통계량과 샤프 비율

모든 트레이딩 전략이나 투자 전략은 그 전략이 내재적으로 가지고 있는 수익의 불확실성이 존재한다. 만약 이러한 불확실성이 존재하지 않는다면 당연히 해당 전략은 완벽한 무위험 차익거래 전략이 될 것이다. 당연히 이러한 무위험 차익거래의 기회를 찾는 것은 쉽지 않으므로, 우리는 어쩔 수 없이 좋든 싫든 간에 불확실성을 언제나 고려해야 한다.

통계 이론이 유용한 이유는 이러한 불확실성을 계량화시킬 수 있기 때문이다. 그렇다면 불확실성이 반영된 전략의 신뢰 정도를 우리는 통계적으로 어떻게 표현할 수 있을까? 이때 필요한 개념이 바로 통계학 기초에서 다루는 t-통계량(t-statistics)과 스튜던트 t-분포(Student's t-distribution)이다. 만약 t 시점에서 T 기간 동안의 평균 수익률과 변동성이 아래와 같이 주어진다면, 우리는 다음과 같이 t-통계량을 계산할 수 있고, 이때 이 통계량은 T-1의 자유도를 가지는 스튜던트 t-분포를 따르게 된다. (물론 이러한 결과를 얻기 위해서는 당연히 수익률이 독립 항등 분포(i.i.d)를 따른다는 가정이 필요하다.)

그런데 퀀트 투자에 관심이 있다면, t-통계량의 모습을 불현듯 어디서 많이 봤다는 생각을 할 것이다. 그렇다. 결국 통계학에서의 t-통계량은 퀀트 투자에서의 샤프 비율(Sharpe Ratio)로 치환된다. 샤프 비율은 한마디로 우리가 어떤 시그널이 통계적으로 유의미하게 받아들일 수 있는가 없는가를 판별하기 위한 도구이다. 예를 들어, 어떤 전략의 샤프 비율이 높으면 높을수록 우리는 해당 전략의 효과에 대한 믿음의 정도를 점점 높여나가게 된다. 따라서 샤프 비율은 통계적 관점에서 확신의 정도를 나타낸다.

# 통계적 가설 검정과 베팅 사이징

우리는 앞에서 확신의 정도를 계량화시키는 데 성공했다. 이제 남은 스텝은 이 계량화된 확신의 정도를 베팅 사이즈라는 수치로 한 번 더 매핑하는 것이다. 다시 말해, 이제 우리에게 필요한 것은 확신의 정도를 베팅 사이즈로 변환해 줄 함수다. 통계적 가설 검정은 이 둘 간의 연결고리를 제공한다.

만약 t-통계량이 구해졌다면, 우리는 이것을 활용해 가설 검정(Hypothesis Testing)을 해볼 수 있다. 통계학에서 가설 검정을 하는 이유는 결국 이러한 통계량이 통계적으로 유의미한지를 판단하기 위함인데, 이를 퀀트적으로 해석한다면 해당 시그널이 유의미한지 아닌지를 판단하고자 하는 것이다.

만약 어떤 전략이 양의 수익률을 제공한다고 하자. 당연히 우리는 이 전략에 투자를 하고 싶을 것이다. 그렇다면 과연 어느 정도의 확실성을 가지고 전략에 투자를 할 수 있을까? 혹은 반대로 해당 전략이 마이너스 수익률을 제공한다고 하면 해당 전략에 대해 숏포지션을 구축하여 수익을 창출할 수도 있을 텐데 어느 정도의 확실성을 가지고 숏포지션을 구축할 것인가?

단측 검정은 이러한 의사결정 문제를 해결하는 데 도움이 된다. 우선, 롱포지션을 고려하기 위해 필요한 귀무가설과 대립 가설은 아래와 같다. 이를 통해 우리는 전략의 플러스 수익률이 통계적으로 유의미한 수준인지 아닌지를 검증해 볼 수 있다.

만약 t-통계량이 0보다 크다면, 이 값은 0부터 무한대 사이의 값을 가질 수 있다. 어떻게 이를 베팅 사이즈로 변환시킬 수 있을까? 여기서 열쇠는 누적 분포 함수(CDF; Cumulative Distribution Function) N이다. 여기서 N(t-stat)은 0.5부터 1까지의 값을 가지게 되는데, 우리는 이를 2*N(t-stat)-1이라는 값으로 바꾸어 베팅 사이즈를 계산하는 함수를 만들어낼 수 있다. 이 값은 0부터 1 사이의 실수값을 가지게 되며, 전체 자본 중 투입되는 금액의 비율을 의미한다.

전략이 마이너스 수익률을 보여 이에 대한 숏포지션을 구축하려는 경우에도 동일한 논리가 적용된다. 다만 이때의 대립 가설은 수익률이 0보다 작다가 될 것이다.

이 경우 t-통계량은 마이너스 무한대부터 0까지의 값을 가지게 되는데, 또다시 누적 분포 함수를 활용하면 -1부터 0까지의 값을 가지기 위한 베팅 사이즈 함수는 동일하게 2*N(t-stat)-1이 된다.

정리하자면 결국 베팅의 사이즈를 결정하는 것은 확신의 정도이며, 우리는 이러한 확신의 정도를 t-통계량이라는 통계적 개념으로 계량화하였다. 또한 통계적 가설 검정과 누적 분포 함수를 사용해 이를 다시 한번 베팅 사이즈로 매핑하였다. 아래의 그래프는 샤프 비율에 따른 베팅 사이즈를 나타낸다. 이 방법론은 결국 시그널의 강도가 커지면 커질수록 베팅 사이즈를 키운다는 것을 직관적으로 알 수 있다. 다시 말해 시그널의 모멘텀을 고려하는 셈이다. 만약 여기서의 샤프 비율이 자산의 샤프 비율이라면 이는 전형적인 모멘텀 전략이 된다.

keyword

매거진의 이전글퀀트 비즈니스와 사일로 효과 영양학: 퀀트 투자에 대한 메타포매거진의 다음글