퀀트 팩터 모델링 #4.
# 연역론적 팩터 모델링의 한계와 통계적 팩터 모델
우리는 지금까지 관찰 가능 팩터와 팩터 복제 포트폴리오, 그리고 횡단면 회귀 분석이라는 세 가지 팩터 모델링 기법을 살펴보았다. 이 세 가지 모델링 기법들은 모두 연역론적 팩터 모델로써 외생적으로 팩터를 정의한다. 즉, 데이터 분석을 하기에 앞서 이 팩터가 어떤 팩터이고 어떻게 정의된 것인지 우리는 미리 알고 분석을 진행하는 것이다.
이러한 연역론적 모델링의 장점은 팩터의 해석이 매우 직관적이고 쉽다는 것이다. 이러한 장점 덕분에 연역론적 모델링은 많은 투자자들에게 널리 사용되고 있다. 하지만 이것은 동시에 한계를 가지고 있다. 우선, 팩터의 선택 자체가 매우 주관적일 수밖에 없다. 또한 팩터들 간의 독립성이 보장되지 않는다. 즉, 상관성이 높은 팩터들이 존재한다면 여기서 다중공선성의 오류가 발생하게 되는 것이다. 팩터 포트폴리오 내에서 다중공선성이 존재하게 되면 이는 테일 리스크에 매우 취약한 포트폴리오가 된다.
따라서 이러한 연역론적 모델링의 한계점을 보완하고자 순전히 통계적 기법에 기반한 귀납론적 모델링이 등장하게 되었다. 통계적 팩터 모델이라고도 불리는 이러한 방법론은 시장에서 관찰할 수 있는 객관적인 수익률 데이터만을 사용해 숨어있는 팩터 수익률과 팩터 익스포져를 직접적으로 추정해낸다. 연역론적 방법과 비교했을 때 여기에는 팩터의 설정이나 선택 혹은 익스포져에 대한 외생적 간섭이 존재하지 않으므로 객관적이며, 또한 대부분의 방법론들이 팩터 간의 직교성을 보장하기에 연역론적 모델링이 가지고 있는 다중공선성의 문제 또한 가지고 있지 않다.
그렇다면 지금부터 귀납론적 모델링의 세계로 진입해보자. 통계적 팩터 모델에는 여러 가지가 있지만, 그 첫 번째 타자는 바로 통계적 연구에서 많이 활용되는 요인 분석이라는 녀석이 담당하고 있다.
# 요인 분석
요인 분석(Factor Analysis)라는 이름이 명시하는 것처럼, 이것은 팩터 모델을 만들기 위한 완전한 다변량 분석 도구이다. 이러한 요인 분석의 기본적인 아이디어는 가장 최소한의 팩터 집합을 통해 전체 수익률 데이터셋의 행태를 설명하는 것이다. 따라서, 이는 표준적인 변수 축소 기법이다.
요인 분석 방법론은 데이터의 원인이 되는 팩터들이 표면 아래에 숨어있다고 가정하고 있다. 그렇기 때문에 이렇게 은닉된 팩터들이 실제 수익률 데이터를 야기하는 것이고, 따라서 수익률 집합을 팩터들의 선형함수로 표현할 수 있다고 생각한다. 또한 은닉된 팩터들은 잠재적인 측정 오차 때문에 어느 정도의 불확실성을 내포하고 있다. 결국 이러한 프레임워크 하에서, 수익률들의 공분산은 두 가지로 분해된다.
1) 팩터에 의해 설명되는 공통 분산(Common Variance), 즉 공통성(Communality)
2) 잔차 분산(Residual Variance), 즉 고유성(Uniqueness)
아래의 그림은 요인 분석 방법론이 가정하는 경로 모형을 보여주고 있다. 기본적으로 공통된 팩터들이 각각의 수익률에 영향을 주게 되는데, 요인 분석의 목적은 바로 실제 데이터에 가장 영향을 많이 미치는 팩터들을 찾는 것이다. 각각의 변수에 대한 잔차 분산은 변수들의 개별 특성만을 내포하게 된다.
# 요인 추출 기법
요인 분석의 문제를 풀기 위해서는 팩터에 관한 외생적 구조나 공통성에 대한 몇 가지 가정들이 주어져야 한다. 팩터의 개수, 팩터 상관계수 행렬에 대한 가정 등이 바로 이러한 가정들의 예시이다. 따라서 요인 분석은 변수들 간의 관계에 대한 이론적 아이디어가 있을 때 사용되는 것이 가장 적합하다. 이러한 외생적 구조가 결정되면, 이제 문제는 데이터에 대한 최적의 패러미터들 - 공통성, 고유성, 팩터 공분산 - 을 찾는 것으로 한정된다. 이러한 문제를 해결하기 위한 여러 가지 추출 기법들(Extraction Methods)이 존재하며, 어떤 기법들은 분산 최대화를 꾀하기도 하고 다른 기법들은 잔차 행렬의 최소화를 추구하기도 한다. 아래에는 이러한 추출 기법들의 대표적인 예시를 나열하고 있다.
- 주성분 기법(Principal Component Method)
- 최소자승법(Ordinary Least Squares)
- 일반화 최소자승법(Generalized Least Squares)
- 최우도추정법(Maximum-Likelihood Estimation)
# 팩터 개수 결정
팩터 모델링은 수익률을 설명하는 팩터의 개수를 결정하는 선택의 문제를 내포하고 있다. 요인 분석에서도 이러한 팩터 개수 결정의 위해 여러 가지 방법론들이 존재한다. 어떤 방법론을 사용할 것인가는 관찰 가능한 데이터의 개수 대비 자산의 개수가 얼마나 큰가에 따라 결정된다.
- 우도비 검정(Likelihood Ratio Test)
- 바이-응 기법(Bai and Ng Method, 2002)
- 고윳값(Eigenvalue)에 기반한 결정
# 요인 회전
요인 분석이 가지고 있는 문제점은 산출된 요인 행렬 자체만으로는 해석을 하기가 어렵다는 것이다. 그렇기 때문에 거의 대부분의 경우에는 팩터를 해석하기 위해 이를 회전시키는 것이 필요하다. 우리는 이를 요인 회전(Factor Rotation)이라 일컫는다. 요인 추출 기법에 의해 직접적으로 산출된 요인 행력, 즉 팩터 익스포져 행렬은 모든 자산에 대해 고유한 익스포져를 가지고 있는데, 요인 회전 기법은 이러한 익스포져들을 차별화하여 행렬을 보다 이해하기 쉽도록 만들어 줄 뿐만 아니라 그 구조 도한 단순하게 만들어준다. 요인 회전은 크게 직교 회전과 사각 회전으로 나뉜다.
- 직교 회전(Orthogonal Rotation)
- 사각 회전(Oblique Rotation)
# 요인 분석의 수학적 모델링
전통적인 요인 분석 모델은 다음과 같이 시간 불변적이고 직교성을 가지고 있는 구조를 상정하고 있다.
n x m 사이즈의 행렬 B는 팩터 로딩으로써 관찰된 수익률과 팩터를 연결해 주고 있으며, Bft와 εt는 각각 수익률을 설명하는 팩터 부분(Factorial Comonent)과 고유 부분(Idiosyncratic Component)을 의미한다. 여기서 D는 대각 행렬을 의미한다.
수익률의 기댓값은 오직 팩터 부분에 의해서만 설명이 되는 반면, 수익률의 분산은 팩터 부분과 고유 부분 두 가지 모두가 영향을 미친다.
요인 분석은 자산 수익률을 견인하는 숨겨진 팩터들을 찾기 위한 아주 강력한 통계적 도구이다. 이러한 요인 분석은 리처드 롤(Richard Roll)과 스티픈 로스(Stephen Ross)에 의해 초창기 버전의 APT 모델에서 사용된 바 있다.
그러나, 여전히 요인 분석에도 몇 가지 한계점은 존재한다. 우선적으로, 요인 분석은 모델의 구조에 대한 수많은 가정들이 필요하다. 일단 팩터의 개수를 알지 못한다. 비록 몇몇 기준들이 존재하기는 하지만 말이다. 어쩔 수 없이 여러 번의 테스트를 통해 정해야만 한다. 문제는 팩터의 개수를 변경할 경우 팩터들이 완전히 바뀌어버리게 된다는 것이다. 이러한 특성은 리스크 팩터들을 온전히 이해하고자 하는 포트폴리오 매니저가 원하는 바가 아닐 것이다. 마지막으로, 전통적인 요인 분석 알고리즘은 고차원 데이터의 분석에는 적합하지 않다는 단점도 있다.
다음에 계속...
Reference
1. 『An Empirical Investigation of the Arbitrage Pricing Theory』, Roll, R. & Ross, S. (1980)