전략 만들기

단순함이 익는 순간: 내가 알파를 찾는 방법

by 싱대디

트레이더들 사이에서 ‘알파’라는 용어는 전략을 뜻하는 경우가 많다. 원래 ‘알파’라는 말은 베타(beta)와 알파 (alpah) 중 알파, 즉 ‘베타에서 제외된 초과성과’를 가리키는 의미로 사용되었으나, 보다 넓은 의미로는 단순히 ‘투자 전략’을 지칭하기도 한다. 이 글에서도 알파를 큰 범위에서 "시장 평균 이상의 초과 수익을 만들어내는 전략 또는 아이디어"로 정의한다.


그럼 알파는 어떻게 찾고 만드는 것인가? 안타깝지만, 정답은 없다. 사람마다 각각의 방식이 있고, 그 방식이 시간과 시장 상황에 따라 변하기도 한다. 아이디어는 하늘에서 ‘뚝’ 떨어지지 않는다.

다양하고 방대한 양의 소스들이 존재하고, 각 소스의 장단점을 이해한 뒤 자신만의 방식으로 처리를 해야한다.


과거의 나는 논문, 기사, 리서치 보고서를 뒤지며 아이디어를 찾는 데 많은 시간을 썼다. 매일 발간되는 자료들은 그 자체로 아이디어의 보물창고처럼 보였다. 그러나 실제로 검증을 해보면, 논문이나 보고서의 결론과는 다른 결과가 나오는 경우가 많았다. 데이터가 같아도 처리 방식이 다르면 결과가 달라지고, 학계에서 가정한 환경과 실제 시장 환경은 다른 점이 많기 때문이다. 그래서 주로 결과를 그대로 믿기보단 핵심 아이디어의 틀을 가져와 내 방식으로 재해석하는 데 집중했다.


또한 최근 몇 년간 머신러닝과 딥러닝이 폭발적으로 발전하면서, 이를 트레이딩에 적용한 사례도 쏟아졌다. 이제는 피처들만 넣으면 트레이딩까지 되는 블랙박스 모델들도 넘쳐난다. 하지만 그 과정에서 많은 리서처들이 '복잡한 모델일수록 더 고급스럽다'는 착각에 빠지는 것을 보았다. 나 역시 한때 그 ‘예술병’에 걸려 있었다. 하지만 현실은 냉정하다. 복잡한 수식과 기법은 본질이 아닌 ‘장식’일 뿐이고, 이를 제대로 이해하지 못한 채 적용하면 오히려 과적합(overfitting)의 함정에 빠지기 쉽다.


아이디어는 어디에서든 찾아올 수 있다. 논문 한 편에서, 신문 기사 한 줄에서, 뉴스 헤드라인이나 차트 한 장에서도 새로운 전략의 단서를 얻는다. 하지만 중요한 사실은, 모든 아이디어가 반드시 수익으로 이어지지는 않는다는 점이다. 게다가 하루에도 수십 가지씩 떠오르는 아이디어들을 하나하나 검증하기에는 시간이라는 절대적 제약이 있다.

그래서 결국 경험이 필요하다. 몇 년의 시행착오와 실패 끝에야 비로소, 나름대로 ‘빠른 1차 필터링’을 거칠 수 있는 눈이 생겼다. 지금은 어떤 아이디어를 접하든 가장 먼저 두 가지 질문을 던진다.


1. 상식적으로 말이 되는 전략인가?

2. 남들이 쉽게 떠올릴 수 없는, 차별화된 전략인가?


이 두 질문에서 걸러지지 못한다면 과감히 버린다. 복잡함보다는 이해할 수 있는 단순함, 단기적인 유행보다는 지속 가능한 논리가 우선이기 때문이다. 언뜻 당연해 보이는 원칙 같지만, 실제로 이 기준을 지켜가며 ‘오랫동안 우상향하는 전략’을 찾는 일은 결코 쉽지 않다.


더군다나 퀀트 세계에서는 더 큰 유혹이 기다린다. 본인이 알지 못하는 논리 그리고 더 나아가 납득하기 어려운 논리에 기반했음에도 불구하고, 당장은 돈을 벌어주는 모델들이 넘쳐나기 때문이다. 당장의 수익을 눈앞에 두고도, 이 모델들을 과감히 거절하는 것은 생각보다 훨씬 어렵다.


2019년쯤, 꽤 오랫동안 효자 역할을 한 모델이 있었다. 발상은 단순했다.

“주식토론방에서의 관심도가 주가에 영향을 미칠 것이다.”

각 나라의 대표 커뮤니티 사이트를 찾았다. 국내의 기준에서는 네이버 종목토론방이 대표적이다. 조회수나 게시글 수가 평소보다 폭발적으로 늘면, 해당 종목에 관심이 높아졌다고 볼 수 있다. 여기서 한 단계 더 나아가, 글의 ‘좋아요’, ‘싫어요’ 수 그리고 글의 길이를 반영해 관심이 긍정적인지 부정적인지를 측정했다.

글의 길이가 길면 대체로 스팸이 아니라 진중한 글일 가능성이 높다.

좋아요가 싫어요 보다 많으면 주가에 긍정적인 영향을 줄 수 있다.

상식적으로 설득력이 있는 접근이었다. 이를 바탕으로 가설을 검증해보았고 백테스트를 한 결과 모델의 수익률이 좋게 나왔다. 더군다나 그 당시엔 텍스트 데이터를 사용하여 트레이딩을 하는 사람도 많이 없었다.


다른 많은 전략들과 비교했을 때 이 전략의 수익성이 막 높진 않았다. 그러나 이 모델처럼 꾸준하게 돈을 벌어다 준 전략도 많지 않았고 그 이유는 위 두가지의 질문에 가장 적합한 답을 했기 때문이라고 본다. 그리고 이렇게 단순하게 시작한 아이디어가 시장에서 수익을 내는 것이 입증된 순간 이를 바탕으로 모델을 깊게 발전시키는 것은 보다 수월하다. 이 전략 또한 발전시키는 그 과정에서 흥미로운 결과도 발견했다. 좋아요 수가 비정상적으로 폭증하거나, 짧은 글이 대량으로 올라오는 경우에는 오히려 주가에 부정적인 경향이 있었다. 실제로 그러한 사례의 글들을 여러 읽어보니, 악재가 터졌을 때 기존 주주들이 내용과 상관없이 ‘좋아요’를 눌러 방어하는 경우가 많았다. 거기에 더해 광고성 글이나 봇이 유입되면서 짧은 글이 급증했다. 이런 ‘역효과’까지 모델에 반영하여 트레이딩을 시작하였고 장기간 좋은 성과를 유지할 수 있었다.


AI가 판을 치는 요즘일수록, 나는 오히려 다시 본질로 돌아가려 한다. 모델의 복잡도가 수익성과 비례하는 것은 아니다. 오히려 단순하고 명료한 원칙이, 길게 보면 더 강력한 힘을 발휘하는 경우가 많다.


매거진의 이전글트레이딩의 첫단추, 전략과 자산 선택하기