brunch

You can make anything
by writing

C.S.Lewis

by 퀀트대디 May 19. 2021

상태-공간 모형과 칼만 필터

퀀트 팩터 모델링 #7.

# 상태-공간 모형

우리가 이전까지 다루었던 통계적 팩터 모델링에 대한 방법들은 사실 상태-공간 모형(State-Space Model)이라는 보다 일반적인 프레임워크 하에서 정리될 수 있다. 그 이유는 바로 이러한 모델들이 공통적으로 상정하고 있는 한 가지 가정 때문인데, 이는 관찰가능한 변수들이 우리가 관찰할 수 없는 숨겨진 팩터들로부터 도출된다는 생각이다. 상태-공간 모형의 세계는 두 가지 방정식을 통해 이를 표현하고 있다.


1) 측정 방정식(Measurement Equation)

2) 상태 방정식(State Equation)


우선 관측 방정식은 은닉된 상태 변수가 관찰가능한 변수에 어떻게 영향을 미치는지를 설명한다. 반면, 상태 방정식은 은닉된 상태 변수들의 고유한 다이나믹스를 모델링한다. 이를 기반으로 상태-공간 문제는 크게 은닉된 상태 변수 그리고 모델 패러미터의 최적값을 찾아내는 것을 목표로 한다. 만약 이를 퀀트 팩터 모델링의 영역으로 치환한다면 은닉된 상태 변수는 숨겨진 팩터들을, 그리고 모델 패러미터는 팩터 익스포져와 상태 변수의 분산 및 잔차의 공분산을 의미한다.


# 칼만 필터

그렇다면 이렇게 관찰할 수 없는 통계적 팩터들을 어떻게 합리적으로 추정할 수 있을까? 칼만 필터(Kalman Filter)는 이러한 상태-공간 문제를 해결하는 대표적인 재귀적 알고리즘 방법론이다. 칼만 필터는 잡음이 섞여있는 관측치들로부터 확률적 추정을 하귀 위해 고안된 수학적 도구로, 이는 1960년 루돌프 칼만(Rudolph E. Kalman)이 이산적 데이터에 대한 선형 필터링 문제를 풀기 위해 고안해냈다.


칼만 필터는 기본적으로 추정된 오차 공분산을 최소화할 수 있는 예측-수정(Prediction-Correction) 모델을 제시하고 있으며, 이는 크게 상태 방정식과 측정 방정식이라는 두 가지 방정식으로 이루어져 있다. 칼만 필터 프레임워크는 기본적으로 은닉된 상태 변수가 현재의 측정치 그리고 다음 기의 상태 변수에 영향을 준다고 가정을 하고 있는 모델이다. 따라서 상태 방정식은 현재 상태가 과거 상태에 의해 어떤 영향을 받는지, 그 다이나믹스를 표현하고 있으며, 측정 방정식은 상태가 어떻게 측정치에 영향을 주는지에 대한 다이나믹스를 표현한다. 두 방정식은 모두 가우시안 분포를 따르는 잡음을 포함하고 있다.


1) 상태 방정식 (State Equation)


2) 측정 방정식 (Measurement Equation)


이를 기반으로 재귀적 알고리즘은 예측과 수정이라는 두 가지 단계를 반복적으로 수행하며, 상태 변수를 추정함에 있어 예측과 측정 간의 오차를 계속해서 반영하게 된다.


1) 예측 단계(Prediction Step)


2) 수정 단계(Correction Step)


우선, 예측 단계에서는 이전 데이터와 구조적 모형을 기반으로 시스템이 미래 상태를 추정하고 동시에 추정의 불확실성에 대해서도 측정한다. 즉, 여기서는 다음 단계로 넘어가기 위한 사전 추정을 하는 것이다. 이후 수정 단계에서 이렇게 미리 예측된 추정치와 실제 관측치를 비교하는 작업을 거치게 되고, 이러한 차이와 오차 공분산 최소화를 위한 칼만 이득(Kalman GainK)을 반영하여 새롭게 상태 변수 예측을 업데이트한다. 이처럼 예측과 수정을 반복적으로 해나가는 것이 칼만 필터 알고리즘의 핵심이다.


칼만 필터 알고리즘은 대부분 동적 선형 모델에 많이 적용된다. 이는 지금까지 우리가 다루었던 선형 팩터 모델에 적용이 가능함을 의미하는데, 그 이유는 이러한 팩터 모델 또한 잔차가 가우시안 분포를 따른다고 가정하고 있기 때문이다. 이 경우 칼만 필터는 최적의 추정치를 제공한다. 또한 칼만 필터는 여러 가지 이점을 가지고 있다. 우선 실무적인 관점에서 보았을 때 이는 결측치를 매우 잘 다룬다. 즉, 행렬 대수학을 사용하고 있는 다른 통계적 기법들의 맹점을 보완해 주는 것이다. 또한 상태-공간 모형은 시계열의 불규칙성을 지니고 있는 데이터도 잘 처리한다. 때로 금융 시계열 데이터에서는 월간과 주간 데이터가 한데 섞여있는 경우가 종종 있는데, 칼만 필터는 이러한 시점의 변화에도 매우 빠르게 반응하는 성질을 가지고 있다. 칼만 필터가 가지고 있는 또 다른 장점은 계산이 재귀적이기 때문에 새로운 데이터가 추가되어도 알고리즘 구동 측면에서 뛰어난 효율성을 보인다.



# 팩터 모델에의 적용

팩터 모델링에 칼만 필터를 적용하기 위해서는 여기서 말하는 상태 변수와 관측 변수를 팩터와 수익률로 치환하여 생각해 보면 보다 직관적으로 접근할 수 있다. 우선 이전에 다루었던 요인 분석 모델을 다시금 상기해보자. 우리는 요인 분석 모델을 다음과 같은 상태-공간 모형의 형태로 표현해볼 수 있다.

팩터가 결국 은닉된 상태 변수의 역할을 하고 있으며, 이를 통해 전략의 수익률이 관찰된다. 이는 상태-공간 모형을 활용한 팩터 모델의 다이나믹스를 표현하는 대표적인 방법이다. 이밖에도 만약 팩터 익스포져를 상태 변수로 설정하거나 혹은 팩터와 익스포져 모두를 상태 변수로 설정할 수도 있다.


다음에 계속...

매거진의 이전글 독립성분분석(ICA)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari