퀀트 팩터 모델링 #9.
# 팩터 모델링의 두 가지 방향 : 탑다운 vs. 바텀업
지금까지 우리는 다양한 종류의 팩터 모델링 기법들에 대해서 알아보았다. 각자의 스타일은 전부 다르지만, 사실 이러한 방법론들은 크게 두 가지 카테고리로 범주화시킬 수가 있다. 한 쪽은 관찰 가능 팩터나 팩터 복제 포트폴리오처럼 우리가 경제학적 논리를 먼저 세우고 팩터를 규정하는 탑다운 방식의 모델링이었고, 다른 한 쪽은 순수하게 데이터적인 관점에서 통계적 분석을 진행하는 바텀업 방식의 모델링이었다.
탑다운 방식과 바텀업 방식은 저마다의 고유한 장단점이 있다.
우선, 경제학적인 논리에 기반하여 팩터 모델링을 진행하는 탑다운 방식의 경우는 팩터에 대한 해석이 매우 직관적이라는 장점을 가지고 있다. 그도 그럴것이 우리가 논리적이고 합리적으로 미리 설정한 팩터가 어떤 의미를 가지고 있는가를 이해하는 것이 그리 어렵지 않기 때문이다. 각종 거시경제적 변수나 밸류, 모멘텀, 캐리 등과 같은 탑다운 방식의 팩터들이 보다 직관적으로 우리에게 다가오는 이유이다. 또한, 이는 탄탄한 경제적 논리에 기반해 있기 때문에 팩터 전략을 운용하는 과정에서 매니저가 해당 팩터에 대해 보다 자신감을 가지고 운용할 수 있다는 장점도 존재한다. 단기적으로 성과가 부진해도 논리가 훼손되지 않는다면 인내심을 유지할 수 있는 것이다.
하지만 이러한 탑다운 방식에도 단점은 존재하는데, 바로 팩터를 선택하는 과정에서 매니저 혹은 트레이더의 주관이 개입될 여지가 매우 크다는 점이다. 결국 탑다운 방식은 팩터를 설계하고 유니버스를 구성하는 것을 매니저의 역량에 맡길 수밖에 없다. 따라서 몇 개의 팩터를 유니버스 안에 편입할 것인가, 그리고 어떤 팩터를 선택할 것인가와 같은 의사결정이 전부 주관적인 판단에 기반한다. 더불어 탑다운 방식의 또다른 단점은 팩터간의 다중공선성 문제가 발생할 수 있다는 점이다. 매니저가 설계한 팩터들이 서로 같은 수익의 원천을 공유하고 있다면, 이는 필연적으로 팩터간의 다중공선성을 높이게 되고, 이를 통해 만들어진 팩터 포트폴리오는 심각한 테일 리스크를 내재하게 된다. 마지막으로 매니저의 재량에 의해 팩터가 선택된다면 자칫 정작 중요한 팩터를 놓치고 가게 되는 기회비용도 발생한다는 점 또한 이러한 탑다운 방식의 단점이다.
그렇다면 통계적 기법에 기반한 바텀업 방식의 모델링은 어떨까? 기본적으로 바텀업 방식의 장단점은 탑다운 방식의 그것과 정반대의 성질을 가지고 있다고 이해하면 편하다.
우선, 바텀업 방식은 순전히 데이터에 기반하기 때문에 주관성이 개입될 여지가 없다. 객관성, 이것이 바텀업 방식의 장점 중 하나이다. 또한 바텀업 방식은 팩터들의 직교성이나 독립성을 만족시킬 수 있다. PCA나 ICA 같은 방법론들이 이러한 기능을 제공하는 대표적인 예시이다. 이는 팩터들간의 다중공선성 문제를 제거하여 보다 안정적인 팩터 포트폴리오를 운용할 수 있는 확률을 높인다.
바텀업 방식의 최대 단점은 탑다운 방식의 장점, 즉 해석가능성의 부재이다. 경제학적 논리에 기반한 팩터와 달리 통계적 팩터는 당연히 그것을 해석하는데 어려움을 겪을 수밖에 없다. 이는 마치 딥러닝 모델이 왜 그러한 패러미터를 선택했는가에 대한 답을 우리가 쉽게 해석하지 못하는 것과 같다. 아무리 데이터에 기반해서 통계적 팩터를 찾았다고 해도 그 팩터가 어떠한 경제적 의미를 가지고 있는가를 찾아내지 못한다면, 매니저는 운용과정에서 여러 챌린지를 받을 수 있다. 이러한 챌린지는 매니저 본인으로부터 나올 수도 있지만, 성과가 부진할 때 탑 매니지머트나 경영진으로부터의 챌린지도 무시할 수 없게 된다. 또한 통계적 기법은 기본적으로 주어진 데이터에 따라 다른 결과값을 제시하므로 데이터의 변화에 매우 민감하게 반응한다.
# 팩터 모델링의 인식론적 종합 : 하이브리드 모델
결국 우리는 둘 중에 하나를 선택하는 것이 문제해결의 정답은 아님을 직관적으로 느낄 수 있다. 즉, 여기서 우리가 알 수 있는 사실은 팩터 모델링에 유일무이한 정답은 존재하지 않는다는 것이다. 그렇다면 어떻게 해야될까? 이러한 문제를 해결하기 위해 최근에는 이 두 가지 방법론을 혼용하는 하이브리드 모델(Hybrid Models)이 이에 대한 대안적 솔루션으로 떠오르고 있다. 각각의 장단점이 명확하게 있기 때문에 서로를 보완해줄 수 있는 방법을 찾게 된 것이다. 이는 대륙의 합리론과 영국의 경험론을 종합해낸 칸트의 인식론과 같은 팩터 모델링적 시도이다.
예를 들어, 우리는 탑다운 방식의 전통적 팩터 모델을 먼저 설계한 다음 이것의 잔차에 대해 통계적 팩터 모델링을 시도할 수 있다. 거시경제학적 모델이 놓치고 갈 수 있지만 중요한 의미를 가질 수 있는 숨겨진 팩터를 찾고 보다 한층 더 깊은 분산투자를 추구할 수 있다는 점에서 이러한 하이브리드 모델은 보호장치 역할을 하는 것이다. 이러한 방식 외에도 탑다운 방식의 모델을 설계하기에 앞서 주어진 데이터를 통계적 모델을 사용해 전처리하는 방식 또한 하이브리드 모델의 또다른 예시이다.
아직까지 한국의 퀀트 업계는 사실 전통적인 탑다운 방식에만 치중해 있는 것이 현실이다. 사실 이마저도 매우 앞서 나간 소리일지도 모른다. 현재 접할 수 있는 대부분의 팩터 분석론이 거시경제적 변수나 몇 가지 단순한 팩터 복제 포트폴리오에만 한정되어 있기 때문이다. 하지만 이것이 퀀트가 찾는 궁극적인 해결책은 아니다. 인간의 직관과 통찰은 잘 활용될 때 매우 파워풀하지만, 명확한 한계점을 지닐 수밖에 없다. 지금까지는 익숙하지 않았을 지도 모르는 통계적 팩터 모델링은 기존의 팩터 방법론이 가졌던 다중공선성 혹은 팩터간 독립성 부재의 문제를 해결하는데 도움을 준다.
이번 시리즈는 팩터라는 나무를 세세하게 들여다보는 것이 아닌 거시적인 관점에서 팩터 모델링의 전체적인 프레임워크를 이해하는 것을 목적으로 구성되었다. 나무보다는 숲을 먼저 전체적으로 조망하는 것이 항상 먼저 선행되어야 하기 때문이다. 멀티 팩터 포트폴리오의 궁극적인 목표와 지향점을 이해하는 것, 이를 달성하기 위해 어떤 접근법을 사용해야 하는가를 아는 것, 그리고 각 시스템이 가지고 있는 장단점을 이해하고 이를 종합하는 것은 장기적으로 자신만의 팩터 모델링을 발전시켜갈 수 있는 자양분이 될 것이다.