퀀트 업계에 계신 여러 정신적 스승들 중 한 분인 캠벨 하비(Campbell Harvey) 형님께서 며칠 전 인탤콘(Intalcon) 매거진에 칼럼 하나를 기고하셨는데, 내용 한 줄 한 줄이 너무나 공감이 되어 아래와 같이 원문을 번역해 공유한다. 퀀트나 금융 머신러닝을 잘못 이해하고 있거나 잘못 사용하고 있는 사람들의 가슴팍에 소리 소문 없이 비수를 냅다 꽂아버리는 하비좌의 펀치라인을 곱씹고 있노라면, 정말이지 쌍따봉을 안 치켜세울 수가 없다. 자, 그럼 시작해보자.
# 우리는 모두 퀀트다
내 논문 『Man vs. Machine (인간 대 기계)』에서 나는 한 가지 흥미로운 실험을 했다. 분석을 위해서는 헤지펀드에 관한 긴 샘플 데이터가 필요했는데, 이 샘플의 절반은 그들이 퀀트(Systematic) 운용인지 아니면 재량적(Discretionary) 운용인지 여부를 밝혔다. 그 외 나머지 절반 샘플은 그들의 운용 스타일을 명백히 밝히지는 않았지만 펀드의 운용 방식에 대한 자세한 설명을 제공했다. 우리는 다음과 같이 자연어 처리 연습을 시작했다. 훈련 샘플에서 퀀트 운용과 재량적 운용을 구분하는 단어와 구문을 찾아낸 후(만약 레이블 값을 알고 있는 경우), 이를 분류되어 있지 않은 수천 개의 펀드에 적용하는 것이었다.
'알고리즘'과 같은 특정 단어는 많은 의미가 있었다. 우리는 '퀀트' 혹은 '계량적'이라는 단어에도 관심을 가졌다. 그런데 놀랍게도 퀀트라는 단어는 퀀트 운용과 재량적 운용을 구분하지 않았다. 실제로 "퀀트"는 재량적 운용 펀드를 설명할 때 더 많이 사용되었던 것이다!
이 현상은 과연 무엇을 의미할까? 이는 단순하다. 계량 분석이 이제는 재량적 펀드와 퀀트 펀드의 구분을 떠나 어떤 형태의 투자 프로세스에서든지 중요하다는 것을 의미하는 것이다. 과거엔 재량적 포트폴리오 매니저가 선호하는 종목에 대한 가치 평가 모델을 스프레드시트에 입력했을지 모르지만, 오늘날의 정보 환경은 정량적 도구의 사용을 요구한다. 이제 투자 전문가들은 수천 개의 데이터베이스를 사용할 수 있으며, 어떤 한 명의 매니저가 이 모든 데이터를 수작업으로 처리한다는 것은 이제 말이 되지 않는다.
이제 우리는 모두 퀀트다. 하지만 그렇다고 해서 모두가 퀀트 포트폴리오를 운용하지는 것은 아니다. 퀀트 투자에서는 규칙이나 알고리즘에 의해 매매가 이루어지지만, 이는 당연히 사람이 설계한 것이다. 이러한 알고리즘은 실제 매매에서 독립적으로 작동한다. 재량적 포트폴리오에서는 매니저가 의사결정 과정을 돕기 위해 여러 정량적 도구를 사용할 수 있지만 최종 매매 결정은 본인이 내린다. 결국 어떤 영역이든 트레이딩 아이디어는 알고리즘이 아닌 사람이 만들어내는 것이다.
# 퀀트의 기원
35년 전만 해도 시스템 트레이딩은 주로 추세 추종 시스템에 초점을 맞춘 틈새시장의 투자 스타일이었다. 초기 알고리즘은 기술적 분석이라는 100년 된 투자 방식을 사용했다. 기술적 분석에는 여러 방법론들이 있지만, 기본적으로 그 토대는 추세의 식별과 외삽이다. 그렇기에 추세 추종이 가진 한 가지 단점은 변곡점을 피할 수 없다는 것이다. 어느 순간 추세는 반전한다. 물론 최근에는 알고리즘이 진화를 거듭해 추세(또는 매우 강력한 추세 신호)가 지속된 후에도 위험은 줄어들 수 있으며, 이러한 기능은 효과적으로 반전을 허용하고 변곡점에서 입을 수 있는 손실을 줄였다.
이후 퀀트의 다음 무대는 정량적 종목 선정 모델이었다. 이 모델은 알고리즘 접근 방식을 사용해 전략이 매수 또는 매도해야 할 주식을 식별했다. 롱온리 포트폴리오의 경우, 이 모델은 증권 비중의 확대와 축소를 결정했다. 이러한 모델은 일반적인 가격 데이터를 넘어 밸류에이션, 성장성, 수익성, 퀄리티 지표와 같은 펀더멘털 정보를 포함하기 시작했다.
퀀트 투자에서 다음으로 중요한 혁신은 이른바 스마트 베타 전략의 등장이다. 이러한 저비용 상품은 밸류와 같은 특정 팩터나 전략에 초점을 맞출 수 있다. 이 스마트 베타라는 이름은 여러 공식 혹은 알고리즘 전략에 적용되었고 종종 인상적인 백테스팅 결과를 제시하며 전략이 스마트하다는 인상을 심어주었다. 물론 기준에 충족하지 못하는 스마트하지 않은 전략들도 많았다. 스마트 베타 전략은 알고리즘 접근법을 사용해 지수를 생성한다. 투자자는 상장지수펀드 또는 뮤추얼 펀드 등 다양한 형태로 이 전략에 접근할 수 있게 되었으며, 또한 스마트 베타 전략은 멀티팩터 버전을 포함하기도 했다.
시장에 더 많은 자본들이 동시다발적으로 유입되면서, 많은 매니저들은 알파를 높이는 가장 쉬운 방법이 비용을 줄이는 것임을 깨달았다. 비용을 줄이는 한 가지 방법은 매매체결을 개선하는 것이었다. 이에 따른 퀀트의 세 번째 물결은 시스템적인 고빈도 매매의 등장이었다. 이러한 방식의 트레이딩은 르네상스 테크놀로지와 같은 펀드에 독립적인 수익성을 제공할 수 있거나 퀀트 펀드 및 재량적 펀드의 매매 체결 전략의 일부가 될 수도 있다.
현재 우리는 퀀트 전략과 재량적 투자 전략 영역 모두에서 인공지능(AI) 도구를 사용하는 시대의 초입에 와있다. 예를 들어, 대규모 언어 모델은 연구원들이 방대한 양의 금융 정보를 분석하고 위험 요인을 분리하는 데 도움을 줄 수 있는 가능성을 가지고 있다.
# 머신러닝
최근 몇 년 동안 머신러닝 도구는 퀀트 투자 전략에 드라이브를 걸기 위해 등장했다. 이러한 도구는 꽤 오래전부터 사용되어 왔다. 실제로 나는 거의 25년 전에 주식 수익률에 대한 딥러닝 도구를 구현하려고 시도했다. 물론 그 모델은 너무나 단순해서 실패했다. 계산상의 제약 때문에 단순했던 것이었다.
머신러닝에 대한 응용이 급증한 데에는 세 가지 특별한 요인이 있다. 첫째, 컴퓨팅 속도가 크게 빨라졌다. 1990년에 Cray 2 슈퍼컴퓨터의 가격은 현재 가치로 3,200만 달러였고, 무게는 5,500파운드였으며, 냉각 장치가 필요했다. 이 슈퍼컴퓨터는 초당 19억 개의 부동소수점 연산을 수행할 수 있었는데, 오늘날의 스마트폰은 Cray 2보다 500배나 더 빠르다.
두 번째 요소는 데이터다. Cray 2 시절에는 1기가바이트의 스토리지 비용이 10,000달러에 달했다. 오늘날 1기가바이트의 비용은 1센트 미만이다. 덕분에 우리는 방대한 양의 데이터를 저렴하게 수집하고 저장할 수 있게 되었다. 저렴한 스토리지와 더불어 데이터 범위는 재무 및 가격 정보를 넘어 다양한 소스(텍스트, 음성, 웹, 위성 지리 정보, 사진 등)의 비정형 데이터로 확장되었다.
세 번째 요인은 오픈 소스 소프트웨어다. 과거에는 소프트웨어 개발이 사일로화되어 있었다. 하지만 지금은 완전히 딴판이다. 이제 엔지니어는 바퀴를 처음부터 다시 발명할 필요가 없어졌기 때문에 개발은 훨씬 더 효율적으로 변모했다. 이제 그들은 깃허브에 들어가 과거 다른 사람들이 직면했던 동일한 문제, 그 문제를 해결한 솔루션을 자유롭게 사용할 수 있게 되었다.
# 퀀트 투자의 장점
가장 큰 장점은 규율(Discipline)이다. 알고리즘은 합의된 규칙들의 집합을 활용해 그러한 규칙들을 구현해낸다. 당연하게도 기계는 직접적인 행동적 편향이 없으며 인간처럼 감정에 휘둘리지 않는다. 실제로 최고의 알고리즘 전략은 다른 사람의 감정적인 선택을 관찰하고, 학습하고, 그로부터 이익을 얻는다. 예를 들어, 알고리즘은 처분 편향에 휩싸여 손실이 나는 거래를 고수하는 등의 행동은 하지 않는다. 기계는 후회를 느낄 수 없다. 또한 시장 긴장이 고조되는 시기에도 기계는 "냉철한 이성"을 고수한다.
퀀트의 두 번째 장점은 기계의 정보 처리 능력이다. 두 가지 요소가 이러한 정보 처리의 가치를 높여준다. 첫 번째는 빅데이터가 폭발적으로 증가함에 따라 기계가 대규모 데이터 세트를 처리할 수 있다는 것인데, 이는 모델 없이 불가능한 일이다. 또 다른 요소는 속도다. 대규모 데이터셋을 처리하거나 시장의 뉴스에 빠르게 반응하는 등 기계는 명백한 이점을 가지고 있다.
# 퀀트 투자의 단점
가장 큰 단점은 유연성이 떨어진다는 점이다. 알고리즘은 세상을 단순화한 것이기에 고도로 매개변수화된 경우가 많다. 모델은 과거 행동에 최적화되어 있으나 세상은 항상 변한다. 매 순간은 항상 다르다. 시간이 지남에 따라 진화하는 믿을 수 있는 알고리즘을 만드는 것은 오늘날의 기술로도 꽤 어려운 과제다. 정상성을 요하는 알고리즘을 비정상성을 가진 시장에 맞추는 것은 실패의 비법이다.
두 번째 단점은 모델 개발 단계에서 과적합의 경향이 있다는 것이다. 알고리즘과 매개변수화는 과거 데이터에 최적화되어 있다. 금융 자산의 경우 잡음 대비 신호가 매우 낮기에 연구자들은 잡음을 최적화하는 경향이 있다. 과적합 알고리즘은 백테스트 상에선 잘 작동한다. 그러나 실제 매매에서 그 성능은 한심한 수준이다.
셋째, 알고리즘은 일반적으로 시장 구조를 고려하지 못한다. 예를 들어, 알고리즘은 시장의 잘못된 가격 책정을 성공적으로 감지할 수 있다. 이러한 경우 모델이 과적합된 것도 아니다.(즉, 백테스트 성과도 과장되지 않았다). 하지만 그럼에도 불구하고 실시간 거래에 이를 적용하면 그 모델은 실패한다. 이러한 실패는 연구 과정의 결함 때문이 아니라, 일시적인 잘못된 가격 책정을 노리는 다른 사람들이 진입하면서 시장이 진화했기 때문이다.
넷째, 일부 투자자는 "블랙박스"의 함정에 빠지기도 한다. 이는 탄탄한 경제적 기반에 기반하지 않은, 순전히 데이터에 기반한 머신러닝 구현에서 종종 발생한다. 투자자는 "내부 기밀이기 때문에 모델이 어떻게 작동하는지는 밝힐 수 없다"는 매니저의 말에 주의해야 한다. 모든 알고리즘은 설명 가능해야 한다. 아무리 복잡한 머신러닝 알고리즘이라도 입력에 충격을 가하여 모델의 출력이 어떻게 변하는지를 확인할 수 있으면 어느 정도의 리버스 엔지니어링이 가능하다.
마지막으로, 새로운 AI 도구는 위험을 수반한다. 예를 들어, 생성형 AI는 과거 데이터를 통해 학습할 수 있고 일부 행동적 편향을 답습할 수 있다. GPT는 비교적 새롭다. 그리고 때로는 현재 세대의 알고리즘에 의해 만들어진 외삽이 문제를 일으킬 수 있다. 이러한 도구를 성공적으로 사용하려면 블랙박스 문제가 있는 상용 제품에 의존하기보다는 자산 매니저가 오픈소스 GPT 도구를 필요에 맞게 미세조정하여 사용하는 것이 가장 좋다.
# 퀀트 투자의 미래
나는 현재 우리가 투자 운용 환경의 티핑 포인트에 있다고 믿는다. 투자자들은 계량적 투자 도구가 당분간만 지속되는 것이 아니라 시간이 지날수록 더욱 각광받을 것이라는 점을 정확히 인식하고 있다. 투자 매니저들은 이러한 도구를 점점 더 많이 채택하고 있다. 하지만 이를 구현하려면 투자와 기술 및 정량적 역량 전반에 걸쳐 상당한 기술과 협력이 필요하다.
현재의 과도기에서, 일부 투자 매니저들은 상황을 전반적으로 재점검해 보고, 현재 가지고 있는 전략에 머신러닝과 AI를 어느 정도 도입할 필요가 있다. 그러나 이러한 투자 매니저들은 상당한 불리한 조건에서 업을 유지하고 있다. 첫째, 이들은 퀀트 모델 개발이나 머신러닝/AI에 대한 전문 지식이 없을 수 있다. 이력서에 머신러닝 강좌 한 개를 수강했다고 써놓은 인턴은 "전문성"을 갖추지 못한 것과 다름없다. 둘째, 수백 가지의 머신러닝 알고리즘과 점점 더 많은 AI 도구가 존재하기에, 당면한 문제에 가장 적합한 접근 방식을 적절히 선택하려면 스킬이 필요하다. 셋째, 경험이 부족한 기업들은 "빅데이터는 공짜"라고 잘못 생각하고 있다. 인터넷에서 데이터를 쉽게 구할 수 있다고 해도 데이터는 공짜가 아니다. 데이터를 정제하는 데는 상당한 주의와 비용이 필요하다. 데이터를 정제하지 않은 상황에서 무턱대고 알고리즘을 적용하면 잘못된 결과를 낳을 수 있다. 넷째, 많은 투자 회사가 이러한 알고리즘을 성공적으로 훈련시키고 실시간으로 실행하는 데 필요한 특별한 컴퓨팅 성능을 갖추지 못했을 가능성이 높다.
지금까지 논의한 점들을 종합해 보았을 때, 많은 투자자들은 실망감을 금치 못할 것이다. 왜냐하면 그들은 자기네들이 최신 기술에 투자를 한다고 생각해왔기 때문이다. 하지만 오직 기술만으로는 초과성과를 낼 확률이 높아지지는 않는다. 초과성과는 투자 문제에 해당 기술을 적용하는 그 팀의 역량에 따라 달려있기 때문이다. 결국 나는 투자 운용 업계의 지각변동을 목격하고 있다. 머신러닝 팀을 고용하거나 안정적인 데이터베이스 관리를 위한 IT 리소스에 투자하거나 필요한 컴퓨팅 자산을 확보하거나 하는 등의 여력이 없는 소규모 기업들은 실패하든지 혹은 경험 및 필요한 기술적 자산을 모두 갖춘 대기업에 인수될 것이다.
쉽게 예측 가능한 한 가지가 있다. 수십 년 전 이론적이기만 했던 연구 프로젝트가 이제는 실행이 가능하다. 이미 퀀트 투자에 대한 연구가 급증하고 있으며, 사실 이는 빙산의 일각에 불과하다. 기관 투자자들은 테일 리스크 헤지 및 디펜시브 오버레이 전략, 그리고 주식-채권 포트폴리오의 일부를 대체하는 자산 배분 솔루션에 등에 퀀트 전략을 점점 더 많이 활용하고 있다. 작년에 우리 인류는 전도유망한 새로운 AI 도구의 출현을 목격한 바 있다. 내가 앞서 지적했듯이 여기엔 경감시켜야 할 리스크가 존재한다. 하지만 동시에 새로운 퀀트 전략들은 포트폴리오 선택을 개선하고 리스크를 줄일 수 있는 가능성을 제시한다. 작금의 시기는 자산 운용 업계에서 몸을 담고 있기에 매우 흥미진진한 시기다.