brunch

You can make anything
by writing

C.S.Lewis

by 투영인 Sep 11. 2024

머신러닝이 포트폴리오 최적화를 어떻게 변화시키고 있는가


투자 산업은 기술 발전에 크게 힘입어 변화를 겪고 있습니다. 투자 전문가들은 포트폴리오 구성 등 투자 과정 전반에 머신 러닝(ML)과 같은 새로운 기술을 통합하고 있습니다. 많은 자산 관리자는 전통적인 방법( 평균-분산 최적화, MVO)으로는 불가능한 더 효율적인 포트폴리오를 추구하며, 포트폴리오 최적화 과정에  ML 알고리즘을 도입하기 시작했습니다. 이러한 트렌드는 포트폴리오 구성 과정에서 ML이 어떻게 변화를 가져오는지에 대해 새로운 시각을 요구하고 있습니다.


투자자들은 ML 알고리즘에 대한 기본적인 이해와 이러한 알고리즘이 포트폴리오에 미치는 영향을 알 필요가 있습니다. 궁극적으로 펀드 매니저가 고객의 포트폴리오를 구성하는 전략은 최종 투자자에게 직접적인 영향을 미치기 때문에, 이러한 방법이 점점 더 인기를 끌고 있는 상황에서 투자자들은 충분한 인식을 가져야 합니다. 


이 글은 포트폴리오 최적화 과정에서 ML 알고리즘이 맡는 역할에 대한 개요를 제공하는 것을 목표로 합니다.



Background


‘머신 러닝(Machine Learning)’이라는 용어는 1959년 A.L. Samuel에 의해 처음 사용되었습니다. 사무엘은 컴퓨터가 체커 게임을 학습하도록 훈련하는 실험을 통해 컴퓨터가 학습할 수 있는 상당한 잠재력을 가지고 있다는 결론을 내렸습니다. 이러한 결과는 이 주제에 대한 추가 연구의 길을 열었고, 이후 수십 년간 점점 더 강력하고 정교한 ML 알고리즘이 개발되었습니다. 그 결과, 최근에는 투자 관리 등 여러 산업에서 이러한 기술을 채택하게 되었습니다.


ML 알고리즘은 고차원 데이터(dimensional data)나 비선형 관계(non-leaner-relationship)가 있는 데이터셋을 분석하는 데 특히 유용합니다. 이는 비정형 데이터 및 기타 대체 데이터 소스의 증가로 인해 점점 더 일반화되고 있습니다. 



1. 고차원 데이터 (High-dimensional data):

- 고차원 데이터란 많은 특성(feature)이나 변수를 가진 데이터를 말합니다.

- 일상생활의 예로, 사람을 묘사할 때를 생각해보세요. 키, 체중, 나이만 사용하면 3차원 데이터입니다. 하지만 혈액형, 학력, 취미, 성격 특성 등 수십 가지 특성을 모두 포함하면 고차원 데이터가 됩니다.


금융에서의 의미:

- 주식 분석 시 주가, 거래량, PER 외에도 수십 가지의 재무지표, 뉴스 감성 점수, 산업 지표 등을 모두 고려한다면 고차원 데이터를 다루는 것입니다.

- 이는 더 풍부한 정보를 제공하지만, 동시에 분석의 복잡성을 크게 증가시킵니다.


2. 비선형 관계 (Non-linear relationship):

- 두 변수 간의 관계가 직선으로 표현되지 않는 경우를 말합니다.

- 예를 들어, 공부 시간과 시험 점수의 관계를 생각해보세요. 처음에는 공부 시간이 증가할수록 점수가 크게 오르지만, 어느 순간부터는 공부를 더 해도 점수가 크게 오르지 않는 경우, 이는 비선형 관계입니다.


금융에서의 의미:

- 주식 시장에서 금리와 주가의 관계를 예로 들 수 있습니다. 금리가 낮을 때는 금리 상승이 주가에 긍정적일 수 있지만, 금리가 특정 수준을 넘어서면 오히려 주가에 부정적인 영향을 미칠 수 있습니다.

- 옵션 가격과 기초자산 가격의 관계도 대표적인 비선형 관계입니다.


이러한 고차원 데이터와 비선형 관계는 전통적인 통계 기법으로는 분석하기 어려웠지만, 머신러닝 기법들은 이를 효과적으로 다룰 수 있어 금융 분야에서 큰 주목을 받고 있습니다.


ML의 두 가지 주요 범주는 지도 학습(supervised learning)과 비지도 학습(unsupervised learning)입니다. 


            지도 학습에서는 ML 알고리즘이 입력 변수(특징) 그룹과 알려진 목표 변수(결과 변수) 간의 패턴을 탐지합니다. 이는 목표 변수가 정의된 ‘레이블이 지정된 데이터셋’이라고 합니다.          

            비지도 학습에서는 데이터셋에 레이블이 없으며, 목표 변수가 알려지지 않은 상태입니다. 따라서 알고리즘은 입력 데이터 내에서 패턴을 식별하려고 합니다.           


아래 테이블은 투자 전문가들이 현재 사용 중인 일반적인 ML 알고리즘을 설명한 것입니다.

알고리즘

투자 전문가들은 새로운 분석 기법이 향후 몇 년 동안 투자 산업에 큰 변화를 일으킬 것으로 예상하고 있습니다. 2022년에 2,000명 이상의 CFA 협회(CFA Institute) 회원들을 대상으로 한 설문 조사에 따르면, 응답자들은 머신 러닝(ML)과 같은 새로운 분석 기법이 향후 5~10년 동안 직무에 가장 큰 변화를 일으킬 요인이라고 예측했습니다. 도표 2는 이러한 결과와 함께 직무에 영향을 미칠 것으로 예상되는 다른 주요 변화를 나타내고 있습니다.



Portfolio Optimization


1960년대 신경망(neural networks)의 개발은 머신 러닝(ML)을 사용한 대안적 포트폴리오 최적화 방법의 기초를 마련했습니다. 또한 "전문가 시스템(expert systems)"의 출현은 투자 전문가들이 복잡한 문제를 해결하기 위해 기계에 의존하는 경향을 증가시켰습니다. 초기 금융 분야에서 전문가 시스템이 사용된 사례로는 거래 시스템 및 재무 계획 시스템이 있습니다.


최근 몇 년 동안 포트폴리오 구성 과정에서 ML 알고리즘의 사용이 점점 더 인기를 얻고 있으며, 투자 전문가들은 포트폴리오 수익을 향상시키고 경쟁 우위를 확보하기 위한 새로운 방법을 모색하고 있습니다. 특히 ML 알고리즘을 포트폴리오 구성에 통합하면 평균-분산 최적화(MVO)와 같은 전통적인 포트폴리오 최적화 방법의 한계와 문제를 해결할 수 있습니다.


MVO의 주요 한계 중 하나는 포트폴리오를 최적화할 때 수익의 평균과 분산만 고려하고, 수익의 왜도(skewness)를 고려하지 않는다는 점입니다. 그러나 실제로 투자 수익은 왜도를 보이는 경향이 있습니다. 


연구에 따르면 성장주는 가치주보다 평균적으로 수익의 긍정적인 왜도가 더 높은 것으로 나타났습니다. 투자 수익의 비정상성을 고려하기 위해 일부 투자 전문가들은 평균-분산-왜도 최적화 모델 또는 평균-분산-왜도-왜도 최적화 모델을 사용해 포트폴리오를 구성하고 있습니다. 


그러나 이러한 모델은 다목적 최적화 문제를 초래합니다. 인공신경망(ANNs)은 이러한 한계를 해결하기 위해 평균-분산-왜도 최적 포트폴리오를 효율적으로 생성할 수 있습니다.


MVO의 또 다른 단점은 투자자가 미래 자산 성과에 대한 자신의 견해를 표현하지 못한다는 것입니다. 예를 들어, 투자자는 향후 6개월 동안 채권이 주식보다 더 나은 성과를 낼 것으로 예상할 수 있습니다. 블랙-리터만(1992) 모델을 통해 투자자는 이러한 관점을 포트폴리오 최적화 프로세스에 통합할 수 있습니다. 


또 다른 접근 방식은 블랙-리터만(1992) 모델을 ANN과 통합하는 것인데, 이는 과도한 위험을 감수하지 않고 높은 벤치마크 상대 수익률을 창출할 수 있는 잠재력이 있습니다. MVO의 입력은 측정 오류에 민감하며, 특히 기대 수익률 추정에서 더욱 그렇습니다. 따라서 MVO는 실적이 저조한 '최적' 포트폴리오를 생성할 가능성이 있습니다. 


역 최적화는 보다 정확한 기대 수익률 추정치를 개발하는 데 유용한 대안이 될 수 있습니다. 투자 전문가는 이렇게 개선된 추정치를 기존 MVO의 입력으로 사용하여 보다 효율적인 자산 배분을 생성할 수 있습니다. 또한 투자 전문가는 ML 알고리즘을 사용하여 주식 수익률을 예측하고 이러한 추정치를 MVO에 통합할 수도 있습니다.


이와 관련해서  최근 연구에서는 상관관계 축소 매개변수를 사용하여 추정 샤프 비율을 개선한 다음 이러한 추정치를 기반으로 최적의 포트폴리오를 생성하는 향상된 포트폴리오 최적화 접근 방식을 개발했습니다.



Conclusions


이러한 트렌드는 투자 전문가들에게 어떤 의미를 가질까요? 분명히, 투자 산업은 새로운 기술에 대응하여 빠르게 진화하고 있습니다. 투자 전문가들은 머신 러닝(ML)과 같은 새로운 분석 기법이 앞으로 몇 년 동안 직무에 큰 변화를 일으킬 것으로 예상하고 있습니다. 그 결과, 실무자들은 ML 알고리즘을 투자 과정 전반에 통합하기 시작했습니다.


많은 자산 관리자는 주어진 위험 수준에서 더 높은 수익률(즉, 더 높은 샤프 비율)을 가진 포트폴리오를 구축하여 경쟁 우위를 확보하려고 ML 알고리즘을 포트폴리오 최적화 과정에 통합하고 있습니다. 또한 ML 알고리즘은 전통적인 포트폴리오 최적화 방법의 많은 문제와 한계를 극복할 수 있어, 투자 전문가들은 더 효율적인 포트폴리오 구성 방법을 모색하고 있습니다. 투자자들은 이러한 트렌드에 대한 인식을 높여 새로운 최적화 방법이 자신의 포트폴리오에 미치는 영향을 더 잘 이해할 수 있을 것입니다.


<출처:Jordan Doyle holds a bachelor of business administration degree with a major in finance from James Madison University and a master of science degree in finance from George Mason University. He is currently a Research Affiliate to the Research and Policy Center at CFA Institute.>




작가의 이전글 지수가 1% 변동할 때 레버리지 리밸런싱 규모는?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari