brunch

You can make anything
by writing

C.S.Lewis

by 퀀트대디 Apr 04. 2021

관찰 가능 팩터

퀀트 팩터 모델링 #1.

# 모델링의 두 가지 방향 : 연역론 vs. 귀납론

1편에 이어, 팩터 모델 프레임워크를 전체적으로 조망하기 위해서는 우선 각각의 모델들이 어떤 관점에서 모델링에 접근하고 있는가를 먼저 이해할 필요가 있다. 결론부터 말하자면, 시장에 존재하는 여러 가지 방법론들은 크게 두 가지 관점으로 분류할 수 있다. 하나는 바로 탑다운(Top-Down) 방식의 연역론적(Deductive) 모델이며, 다른 하나는 반대로 바텀업(Bottom-Up) 방식의 귀납론적(Inductive) 모델이다. 각각의 방식은 대륙의 합리론과 영국의 경험론으로 자연스럽게 대유 된다.


각각을 보다 구체적으로 살펴보자면, 우선 탑다운 방식의 연역론적 모델은 어떠한 경험적 증거 없이 추상적인 이론이나 가설을 먼저 설정하는 방법론을 의미한다. 우리가 일반적으로 알고 있는 대부분의 팩터 모델링이 바로 이러한 연역론적 방식을 따르고 있다. 예를 들어, 우리는 밸류(Value)나 모멘텀(Momentum), 캐리(Carry) 같은 이론적 메커니즘을 먼저 세우고 난 뒤에 그것을 검증한다. 다시 말해, 합리적인 논리 전개 과정을 통해 아이디어를 먼저 구상해보는 것이다.


반대로 바텀업 방식의 귀납론적 모델은 이론부터 내세우기보다는 실제 데이터가 우선이 되어 이를 가지고 그 속에 숨겨진 팩터들을 찾고자 하는 방식이다. 이러한 방식의 기본적인 생각은 실제 데이터가 가장 중요하다는 것이며, 그렇기 때문에 여러 통계적 기법을 사용해 통계적 팩터를 먼저 찾는다. 주성분분석(PCA; Principal Component Analysis)이나 독립성분분석(ICA; Independent Component Analysis), 그리고 클러스터링 기법(Clustering Techniques) 같은 방법론들이 이러한 귀납론적 모델의 대표적인 예시이다. 최근 머신러닝 및 딥러닝 기술의 발전은 이러한 통계적 팩터 모델링에 점점 더 힘을 실어주고 있다.



# 탑다운 방식의 시초, 관찰 가능 팩터

팩터 모델의 가장 초창기 버전은 시장에서 관찰 가능한 지표들을 팩터로 삼는 것에서부터 출발했다. 그 이유는 이것이 가장 단순한 방법일 뿐만 아니라 윌리엄 샤프 CAPM과 스티픈 로스의 멀티팩터 모델 같은 고전적 방식의 모델들이 모두 이러한 접근법에서부터 시작을 했기 때문이다. 예를 들어, 로스는 주가 수익률이 임의의 거시경제 변수 움직임에 의존한다고 가정하였다. 실제로 로스는 이후 1980년 리처드 롤(Richard Roll)과 함께 발표한 논문에서 물가, GNP, 회사채 프리미엄, 그리고 금리 커브의 움직임이 S&P 수익률을 설명하는 팩터들이라고 제시한 바 있다.


관찰 가능 팩터(Observed Factors)는 말 그대로 시장에서 관찰할 수 있는 지표들을 팩터로써 사용하는 방법론이다. 다시 말해, 팩터 수익률이 외생적인 시계열 변수에 기반하여 직접적으로 명시되어 있는 것이다. 이와 관련된 팩터들의 범주는 매우 다양하지만 일반적으로 투자자들은 아래와 같은 팩터 카테고리에 관심을 가지고 있다.


거시경제 팩터 (Macroeconomic Factors) : 금리, 산업 생산, 크레딧 스프레드, 소비자심리, 유가, 물가 등

시장 팩터 (Market Factors) : 글로벌 주가지수

섹터/산업 군 팩터 (Sector / Industry Factors) : 섹터지수

국가 팩터 (Country Factors) : 국가 지수, 선진국 지수, 신흥국 지수

펀더멘털 팩터 (Fundamental Factors) : 기업 펀더멘털 특성에 기반한 지수



# 관찰 가능 팩터의 수학적 모델링

관찰 가능 팩터를 사용한 모델링은 말 그대로 시장에서 관찰할 수 있는 팩터들을 사용해 투자자산이나 전략의 수익률을 설명하고자 한다. 그렇기 때문에 결국 이것은 팩터 수익률을 독립 변수, 자산 수익률을 종속 변수로 한 고전적 방식의 시계열 회귀 분석 모형(Classical Time-Series Regression Model)이다. 이것은 팩터 수익률(Factor Returns)과 자산 수익률(Asset Returns) 두 가지가 주어졌을 때, 이 둘 간의 관계를 설명할 수 있는 팩터 로딩(Factor Loadings), 즉 팩터 익스포져(Factor Exposures)를 추정하는 가장 쉽고 단순한 방법론이다.


만약 n개의 자산과 k개의 팩터가 주어진다면, 우리는 각각의 자산 i(i = 1,2,...,n)에 대해 시점 1부터 T까지의 시계열 데이터를 확보할 수 있고, 아래와 같이 단순한 회귀 분석 모형을 통해 팩터 익스포져를 추정할 수 있다. 또한, 이는 자산 i에 대한 회귀 분석이므로, 만약 전체 n개 자산에 대해 총 n번의 회귀 분석을 수행한다면 전체 팩터 익스포져 행렬을 갖게 된다.



# 관찰 가능 팩터 모델링의 장단점

관찰 가능 팩터는 팩터 모델링의 역사에서 가장 초창기 모델이기는 하나 이것이 실무자들 사이에서 아직까지도 널리 사용되고 있는 이유는 이러한 팩터들에 대한 접근이 매우 쉬울 뿐만 아니라 명백한 해석을 제공하기 때문이다. 다시 말해, 시장에서 관찰 가능한 팩터들의 경제적 함의가 무엇인지 추가적으로 생각할 필요가 없는 것이다.


하지만 이러한 방법론에는 심각한 문제점들이 있다. 우선, 어떤 팩터를 선택할 것인가 하는 것이 매우 임의적인 문제이다. 즉, 팩터 유니버스를 구성하는 것이 순전히 투자자의 선호에 의해 결정되는 것이다. 또한 데이터의 기간을 어떻게 설정하는가에 따라 추정치가 계속해서 변한다. 예를 들어, 1년의 기간을 선택할 것인가, 아니면 5년의 기간을 선택할 것인가에 따라 팩터 익스포져의 추정치가 가변적인 것이다. 아래의 예시는 추정 기간이 1년인지 혹은 전체 기간인지에 따라 팩터들 간의 상관계수 행렬이 달라지는 것을 여실히 보여주고 있다.

추정기간에 따른 상관계수 행렬의 변화 : 1년 vs. 전체 기간

관찰 가능 팩터가 가지고 있는 마지막 문제점은 바로 팩터들 간의 독립성이 보장되지 않는 것이다. 시장에서 관찰되는 여러 가지 팩터들은 시장 상황에 따라 본질적으로 높은 상관관계를 가지게 될 개연성이 높다. 팩터 모델이 좋은 표본 외 성과를 보이기 위해서는 기본적으로 독립적인 팩터들의 유니버스를 요구하는데, 만약 이러한 조건이 만족되지 못한다면 모델은 쉽게 과최적화되고 실제 운용 과정에서 좋지 못한 성과를 보이게 될 확률이 높다. 이른바 다중공선성(Multicolinearity)의 오류가 발생하게 되는 것이다. 이러한 다중공선성의 문제는 사실 대부분의 연역적 모델들이 가지고 있는 문제이다.


Reference

1. 『An Empirical Investigation of the Arbitrage Pricing Theory』, Roll, R. & Ross, S. (1980)

매거진의 이전글 팩터 모델링 프레임워크의 시작
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari