brunch

You can make anything
by writing

C.S.Lewis

by 퀀트대디 Feb 27. 2021

머신러닝 퀀트의 시대, 새로운 블루오션

# 다가올 금융 머신러닝 혁명

향후 빅데이터와 머신러닝 혁명은 투자 업계의 지평을 송두리째 바꾸게 될 것이다. 점점 더 많은 투자자들이 빅데이터를 도입함에 따라, 금융시장은 지금보다 더 빠른 속도로 반응하고 있으며, 나아가 심지어는 기존의 전통적인 데이터를 예측하는 수준에까지 이르게 될 것이다. 이러한 변화의 흐름은 퀀트들 그리고 새로운 데이터와 새로운 분석 기법을 받아들이고자 하는 사람들에게 엄청난 엣지를 선사할 것임은 명약관화하다. 또한 반대로 이를 배우고 진화하길 거부한다면 조만간 쓸쓸히 형장의 이슬처럼 사라지게 될 것이다. 이는 1000일째 주어지는 모이를 실컷 먹다가 천하루 날 목이 날아가는 칠면조의 운명과도 같다.


19세기 개항을 거부하고 쇄국정책을 펼쳤던 조선의 말로는 어떠했는가. 역사는 반복된다. 19세기 강화도 앞바다에 등장한 흑선(黑船)은 이후 조선의 명운을 송두리째 바꾸었다. 이지성 작가는 그의 저서 『에이트』에서 인공지능을 21세기의 새로운 흑선에 비유하고 있다. 현재의 신문물은 바로 빅데이터와 인공지능이다. 이러한 신문물을 받아들일 것인가의 여부에 따라 앞으로의 커리어 전망과 방향은 확연히 차이를 보이게 될 것이다.

이제는 시간문제일 뿐이지만 결국엔 리서치 애널리스트와 포트폴리오 매니저, 트레이더, 그리고 CIO 등 금융권의 모든 의사결정자들은 빅데이터와 머신러닝이라는 도구에 친숙해져야만 한다. 마치 우리가 지금 엑셀을 자유자재로 사용하여 업무를 하는 것처럼 미래에는 이러한 분석 도구 없이는 의사결정을 내린다는 것이 불가한 세상이 될 것이다. 이러한 흐름은 기본적, 기술적 분석을 하든 계량적 분석을 하든지에 상관이 없으며, 또한 어떤 자산군을 다루는가에도 상관이 없다.



# 금융 머신러닝으로의 전환 속에서 넘어야 할 난관

머신러닝은 미래이다. 하지만 금융 머신러닝 프레임워크로의 전환에도 난관은 존재한다. 첫 번째 난관은 바로 빅데이터 그 자체이다. 특정 유형의 데이터들은 도움이 되기보다는 막다른 골목으로 우리를 이끌 수 있다. 예를 들어, 알파를 함유하고 있지 않은 데이터나, 알파가 있음에도 불구하고 자금 수용력이 없는 전략들, 알파가 매우 빨리 사라지는 데이터나 가격이 너무 비싼 데이터 등이 이에 속한다. 특히나 많은 투자기관들이 빅데이터가 미래의 먹거리임은 알고 있지만, 빅데이터 인프라를 구축하기 위해서는 어마어마한 자본이 투입되어야 함을 알기에 이를 상당히 꺼리고 있는 상황이다. 따라서 자금력을 갖춘 대형 금융기관들이 이를 먼저 시도하여 새로운 먹거리를 선점하게 될 가능성이 높다. 아직은 이를 구축함으로써 얻는 한계 효용이 한계 비용보다 작은 것이 사실이다.


또한 머신러닝 알고리즘은 인간의 직관을 완벽히 대체할 수 없다. 머신러닝 알고리즘이 잘못 사용된다면 매우 쉽게 과최적화를 일으키거나 가성적 패턴을 계속해서 찾게 되는 문제점이 있다. 머신러닝이 아주 좋은 도구임에는 분명하나, 금융 데이터와 투자 의사결정의 문제는 일반적으로 머신러닝 알고리즘이 해결하고자 하는 것들과는 전혀 다른 성질을 가지고 있다. 실패하는 머신러닝 기반 퀀트 펀드들은 모두 이러한 문제점을 가지고 있다.


그렇기 때문에 다른 산업군과 비교했을 때 금융 머신러닝 세계는 인적자원의 확보라는 문제에 처해있다. 사람들은 일반적인 머신러닝 솔루션을 그대로 금융에 적용해도 될 거라는 생각을 가지고 있고, 이 때문에 일반적인 데이터 과학자들을 채용하여 금융 문제를 해결하려고 한다. 하지만 일반적인 머신러닝 알고리즘이 똑같은 효과를 보일 것이라는 생각은 크나큰 착각이다. 실제로 유명한 머신러닝 모델들의 예측력은 8,90%의 예측력을 자랑하지만 금융시장에만 오면 이상하게 60%도 넘기지 못하는 것이 부지기수이다. 이러한 결과가 나오는 이유는 금융시장의 데이터가 가지고 있는 고유한 특성 때문이다. 즉, 금융 도메인 지식이 부재한 데이터 과학은 좋은 결과를 낼 수가 없다.


그렇기 때문에 어쩌면 금융 머신러닝을 가장 빠르게 효율적인 방법은 기존의 전통적 퀀트나 트레이더들이 머신러닝 방법론을 도입하는 것이다. 문제는 기존의 금융 분석 방법론들은 클래식한 연역론적 사고방식을 가지고 있다는 것이다. 이는 먼저 논리적으로 그럴듯한 모델을 설계한 다음에 실증적으로 이를 분석하는 방식이다. 고전적인 계량적 모델들은 모두 이러한 방법론을 따르고 있다. 머신러닝이 종종 블랙박스라고 치부되는 이유는 바로 이러한 사고방식 때문이다. 하지만 제대로 된 방법으로 사용되기만 한다면 머신러닝은 더 이상 블랙박스가 아니다. 따라서 전통적인 퀀트나 트레이더들에게 필요한 것은 바로 관점의 융합이다.


임마누엘 칸트는 『순수이성비판』에서 인간이 이성적 능력을 본래부터 가지고 있지만 그 내용은 경험적으로 얻을 수밖에 없다고 보았으며, 동시에 우리는 경험을 재료로 하고 있지만 또 이와는 상관없이 이성적 능력을 통해 보편적 진리에 도달할 수 있다고 보았다. 즉, 그는 관념론을 통해 합리론과 경험론을 하나로 통합하게 된 것이다. 따라서 앞서 언급한 관점의 융합이라는 것은 금융 머신러닝을 다루는 머신러닝 퀀트가 추구해야 할 정수라고 볼 수 있다.



# 새로운 블루오션의 기회

현재 머신러닝 전문가들은 금융에 익숙지 않고, 금융 전문가들은 머신러닝에 익숙지 않다. 또한 우리가 일반적으로 생각하는 것처럼 금융 머신러닝이란 그저 일반적인 머신러닝 기법을 금융에 적용하는 것과 같이 단순한 일이 아니다. 왜냐하면 일반적인 머신러닝과 금융 머신러닝은 전혀 다른 차원의 머신러닝 영역이기 때문이다.

따라서 이러한 관점에서 보았을 때 머신러닝 퀀트는 이전까지의 퀀트, 이전까지의 데이터 과학자와는 다른 새로운 종(種)의 퀀트이다. 금융 머신러닝 분야의 최고 권위자인 마르코스 로페즈 데 프라도(Marcos M.López de Prado) 교수는 아직 제대로 된 머신러닝 퀀트 펀드가 많지 않다고 말하고 있는데, 그 이유는 사람들이 일반적인 머신러닝과 금융 머신러닝의 차이를 호도하여 머신러닝을 잘못 사용하고 있기 때문이다.


하지만 역발상적으로 이러한 현실은 새롭게 부상하게 될 머신러닝 퀀트에게는 엄청난 기회가 될 것이다. 아직 무주공산과도 같은 이 영역을 누가 먼저 선점하여 금융 머신러닝 시대의 알파를 창출할 수 있는가는 전적으로 새로운 영역을 개척하고자 하는 의지, 그리고 그러한 의지의 발현에 달려있다.


수준 높은 퀀트 컨퍼런스를 주최하는 업체인 퀀트마인드는 과거 트위터를 통해 전 세계의 퀀트를 대상으로 설문조사를 진행한 바가 있다. 바로 향후 미래에 퀀트업계에 중요한 것이 무엇인가에 대한 설문조사였다. 놀라웠던 점은 응답자의 절반 이상이 향후 퀀트업계에 가장 크게 영향을 미칠 요소로써 머신러닝을 꼽았다는 점이다. 또한 향후 퀀트업계에서 가장 크게 성장하게 될 영역으로 그들은 인공지능을 선택했다. 이러한 설문조사는 결국 금융 머신러닝이라는 것이 2020년대의 불가항력적 트렌드가 될 것임을 아주 명쾌하게 보여주고 있다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari