한국시장을 예측할 때는 한국만의 데이터로도 충분합니다.
매일 아침 눈을 뜨면 습관처럼 미국 증시 결과를 확인하는 분들이 많으실 겁니다. "나스닥이 오르면 우리 기술주도 오르겠지?" 하는 기대감은 어쩌면 당연한 일일지도 모릅니다.
"데이터는 많으면 많을수록 좋다(The More, the Better)." AI와 빅데이터의 시대에 이 말은 마치 금과옥조처럼 여겨집니다. 주식 투자에서도 마찬가지입니다. 전 세계 모든 기업의 데이터를 긁어모아 만든 '궁극의 AI 모델'이 있다면, 미래 주가를 정확히 예측해 우리를 부의 길로 이끌어 줄 것만 같습니다.
하지만 정말 그럴까요? 수십 년 치 글로벌 데이터를 학습한 '만능 AI'가, 내가 가장 잘 아는 '대한민국 시장' 데이터만 집중적으로 학습한 '국내파 AI'보다 항상 뛰어난 성과를 낼까요?
최근 이 본질적인 질문에 대해 매우 흥미로운 답을 제시한 연구 논문, "The More, the Better? Predicting Stock Returns with Local and Global Data(2025년 4월 1일)"를 심층적으로 분석해 여러분께 소개해 드립니다.
자산 가격 결정(asset pricing)에 있어서 국제 데이터는 항상 더 나은 선택일까? 이 질문에 대한 답은 시장 구조, 즉 해당 시장이 통합(integrated)되어 있는지 아니면 분할(segmented)되어 있는지에 따라 달라집니다.
분할된 시장에서는 주식 가격이 주로 현지 요인에 의해 형성됩니다. 투자자들은 자국 중심의 정보와 위험 요소에 더 민감하게 반응하며, 그 결과 지역별 특성에 맞춘 모델이 수익률의 횡단면적 편차(cross-sectional variation)를 더 잘 설명할 수 있습니다.
반면에, 통합된 금융 시장에서는 가격 결정 구조가 전 세계적으로 유사하게 작동하며, 이런 경우에는 다양한 국가 데이터를 포괄하는 글로벌 모델이 더 나은 성과를 보일 수 있습니다. 이유는 단순합니다. 글로벌 모델은 더 큰 데이터셋을 바탕으로 예측력과 안정성 측면에서 이점을 제공하기 때문입니다.
하지만 지금까지의 연구들은 이 질문에 대해 일관된 결론을 내리지 못하고 있었습니다. 일부 연구는 수익률 예측 변수들이 전 세계적으로 유사하다고 보고하고 있으며(Fama & French, 2017; Hollstein, 2022a), 글로벌 요인이 주도적인 역할을 한다는 주장도 있습니다(Hellum et al., 2023). 반면, 현지 요인이 더 강력한 설명력을 가지며, 글로벌 데이터를 추가하는 것의 이점이 크지 않다는 연구도 존재합니다(Fama & French, 2012; Chaieb et al., 2021).
분석 기간: 1994년 1월부터 2023년 12월까지 30년간의 데이터를 사용했으며, 실제 모델 테스트 기간은 2004년부터 시작되었습니다.
분석 대상: 전 세계 45개 시장(선진국, 신흥국, 프런티어 시장 포함)에 상장된 80,692개 기업의 데이터를 분석했습니다.
변수: 주가 수익률 예측을 위해 기존 금융 연구에서 널리 사용되는 147개의 주식 특성 변수(stock characteristics)를 활용했습니다.
머신러닝 기법: 주된 분석 도구로 '엘라스틱 넷(elastic net)' 회귀분석 모델을 사용했습니다. 이 모델은 다수의 변수 중 예측에 가장 중요한 변수들을 선택하고, 변수 간 다중공선성 문제를 완화하는 장점이 있습니다.
모델 비교: 연구팀은 예측 모델의 성과를 여러 차원에서 비교했습니다.
현지 모델 (Local Models): 특정 국가, 지역, 산업, 섹터 데이터만으로 학습된 모델입니다.
글로벌 모델 (Global Models): 45개 시장의 모든 데이터를 통합하여 학습된 모델입니다.
소프트 전송 모델 (Soft Transfer Models): 글로벌 모델의 정보와 현지 모델의 고유 정보를 결합하려는 시도입니다.
성과 측정: 모델의 예측력은 통계적 성과(표본 외 결정계수, R²)와 경제적 성과(예측 수익률 기반 롱숏 포트폴리오의 샤프 비율 및 CAPM 알파)로 평가되었습니다.
지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.
오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠