퀀트 팩터 모델링 #3.
# 팩터의 횡단면 분석
지금까지 우리가 다루었던 방법론들은 모두 우리가 팩터를 이미 안다는 가정하에 시계열 회귀를 통해 팩터 익스포져를 추정하는 방식이었다. 여기서는 이 문제를 살짝 비틀어 횡단면적인 관점에서 팩터 익스포져가 먼저 주어지고 이를 통해 팩터의 수익률을 추정하는 방법에 대해서 다루고자 한다.
일반적인 방법론은 여러 개의 팩터들이 하나의 수익률에 어떻게 영향을 미치는가에 관심이 있었다. 하지만 이와는 다르게 팩터의 횡단면 분석은 관점을 살짝 틀어 특정 시점에 어떤 하나의 팩터가 수많은 자산들의 수익률에 어떤 영향을 미치는지를 찾고자 한다. 이를 위해서는 각각의 시점에서 모든 자산들 혹은 전략들의 수익률과 이에 대한 팩터 익스포져 값들이 주어져야 하고, 이를 통해 팩터의 수익률을 추정해낸다.
팩터 익스포져 값들이 부여되기 위해서는 각각의 자산들에 대해 고유한 특징을 지니고 있는 데이터들이 필요하다. 대표적인 예시로 만약 주식 영역에서의 팩터 분석을 한다고 하면, 각 주식에 대한 기업 고유의 특징을 지니는 데이터들이 필요하며, 이러한 데이터들은 아래와 같은 범주로 나누어볼 수 있다.
- 펀더멘털 데이터(Fundamental Data) : PBR, PER, 배당률, 시가총액, 수익성 지표, 레버리지
- 섹터 / 국가 데이터(Sector / Country Data) : 섹터, 산업군, 국가를 구분할 수 있는 더미 변수
- 기술적 데이터(Technical Data) : 장단기 모멘텀 지표, 역추세 지표 등
# 횡단면 회귀분석의 수학적 모델링
팩터의 횡단면 분석이라 함은 주어진 특정 시점에서 어떤 하나의 고유한 특징과 전체 주식들의 수익률 간의 관계, 즉 팩터의 수익률을 추정하는 것을 의미한다. 이러한 문제는 앞서 다루었던 시계열 회귀 문제를 다른 각도에서 바라본 것이다. 시계열 회귀 문제에서는 자산 수익률과 팩터 수익률이 주어졌고 이를 통해 팩터 익스포져를 추정했었다면, 횡단면 회귀 문제에서는 자산 수익률과 팩터 익스포져가 주어지고 이를 통해 팩터의 수익률을 추론해낸다.
n개의 자산과 k개의 팩터가 존재한다면, 우리는 각각의 t(t=1,...,T) 시점에서 자산 수익률과 팩터 익스포져 간의 회귀 분석을 진행한다.
각각의 시점에서 우리는 k개의 팩터 수익률 벡터인 f를 추정하게 되고, 모든 시점의 회귀 분석을 마치게 되면 팩터 수익률의 행렬이 완성된다.
여기서 주의해야 할 점은 팩터 익스포져로 사용될 수 있는 지표들이 굉장히 방대하므로, 횡단면 회귀를 진행함에 앞서 이러한 지표들을 우선 정규화해야 한다는 것이다. 또한, 시스템 업데이트의 관점에서 만약 팩터 익스포져를 하나 더 추가하고 싶다면, 전체 시스템이 처음부터 다시 돌아가야 한다.
# 팩터 횡단면 분석의 장단점
이러한 방법론이 가지고 있는 장점은 바로 투자자가 모델에 입력할 수 있는 기업 고유의 특징들이 아주 방대하다는 것이다. 이러한 특징들은 사실 기본적 분석의 핵심이 되는 사항이며, 또한 이는 명백한 이유에 의해 주식 수익률에 지대한 영향을 미친다. 따라서 어떤 기업의 펀더멘털에 변화가 생기면 이 모델은 매우 유연하고 신속하게 이에 반응한다.
하지만, 횡단면 분석 모델은 각각의 기업에 대해 수많은 변수들을 요구하므로 매우 데이터 집약적이라는 단점이 있다. 또한 이것은 물가, GDP 같은 거시경제적 팩터들을 포함하기 힘들다는 단점도 가지고 있으며, 마지막으로 이 또한 팩터 선택의 임의성 문제가 존재하기에 연역적 모델링이 가지고 있는 한계 또한 고스란히 지니고 있다.