brunch

인공지능으로 금융시장 변동성 예측하기 2부

아고라타임스 인공지능 시리즈

by 박정수

이 글은 아고라타임스에 제가 기고한 글을 다시 정리해서 올린 내용입니다.

https://www.agoratimes.com/news/articleView.html?idxno=216092


입력 2024.11.02

작성 : 박정수

이 글은 주식투자에서 중요한 천장과 바닥을 찾는 학술이론을 소개하고자 합니다. 남들은 다 파는 데 나 홀로 열심히 사고 있다면 결과는 뻔하겠죠? 그러면 통계학적으로 지금은 천장인가요? 아니면 바닥인가요? 지금부터 같이 찾아봅시다.


우리는 회귀분석이나 인공지능 예측을 하면서 과연 이 모델이 얼마나 학습을 잘했는지를 Mean Squared Error(MSE)와 같은 지표로 비교를 하는데, 그 수식은 다음과 같고, 그 의미를 그래프로 시각화했습니다.

216092_217281_1755.jpg

여기서 n은 데이터 포인트의 총 개수, y_i는 실제 값, (y_i ) ̂는 예측 값을 나타냅니다.


Loss는 최초 1회의 학습에는 0.5273로 매우 높았지만 1000번을 학습하는 과정에 0.0189로 줄어들었습니다. 아래의 그래프를 보면 진폭이 커지면서 Loss가 지속적으로 우하향(Loss감소)하는 것을 볼 수 있습니다. PINN이라는 모델이 여타 경쟁모델들로는 수렴하기 어려운 비선형 곡선에서 탁월한 안정감을 보인다는 것을 증명하고 있습니다.

그림3.png


* https://www.nature.com/articles/s41598-023-49977-3/figures/1



그리고 다음 도표에서 보이듯이 PINN은 무수한 편미분 계산이 필요하다는 것을 알 수 있습니다. 그런데 손으로 하나하나 계산하는 것이 아니고 자동으로 미분을 계산해 주는 함수(가령 pytorch의 auto-differentiation features)가 개발되어 PINN이 등장할 수 있는 한 배경이 되었습니다.

그림3-4.png

이런 장점을 이용하여, 현재 기후 변화 예측/극한 기상 현상 모델링/지진 예측/해양 순환 모델링/대기 흐름 시뮬레이션 등 전통적인 물리학분야는 물론 새로이 확장되는 분야로는 종양성장 예측/금융 공학(옵션 가격 결정/리스크 관리 모델링/금융시장 예측)/로봇 동작 제어/오염물질 확산 모델링/무선 네트워크 최적화 등 점차 더 복잡하고 다양한 학술연구가 진행 중입니다. 그리고 개인적으로 매우 좋은 박사논문 주제가 되리라 믿습니다.


2. Deep-LPPLS 소개.

이제 PINN까지 Deep-LPPLS의 핵심엔진인 PINN을 공부했으며, 이제는 LPPLS라는 이론에 이 PINN을 첨부시켜서 주가를 예측하는 과정만 즉 “Deep-LPPLS”를 이해하는 일이 남았습니다. 여기에는 전통적인 인공지능 모델이 아닌 PINN답재되었다는 장점이 있습니다. 그러나 아직은 PINN 주가예측에 활용된 논문도 많지 않아 응용력이 떨어지고, 여전히 사회과학이라는 세계를 예측하기에는 PINN이라는 Architecture하나로는 역부족일 수 있습니다. 더욱이 Vanilla-LPPLS(기존의 LPPLS)에 인공지능을 탑재했다고 갑자기 주식가격이 정확하게 예측된다는 보장이 있는 것도 아닙니다. 그것은 사회과학 그 자체가 변수가 무한대인 deep-learning이기 때문입니다. 그럼에도 불구하고 우리가 사력을 다해 이런 어려운 공부를 하는 것은 투자의 성공을 위해 1%라도 더 발전하고 진화하려는 노력이라고 간주해야 합니다. 그리고 자연과학에서처럼 PINN의 활용도가 높아지는 과정에서 다양한 사례들이 공유되고, 이를 통해 더 발전적인 투자모델이 탄생할 수 있다는 것에는 동의를 합니다.

그림3-5.png


만일 가령 향후 30년 후 물리학(의학적)적으로 인간의 최대수명이라고 알려진 120살 이상으로 생존 가능성을 모델링을 하는데, 200살, 300살 등의 숫자는 데이터는 아무 의미가 없음으로 데이터의 최댓값=150 등 제약하는 조건을 줄 수 있다면 더 신속하게 모델이 완성될 수 있듯이, 수요와 공급의 법칙에서 수요와 공급이 일치할 때 가격이 생긴다. 매입가와 매도가가 동일할 때 거래가 체결된다 등 정보를 코딩해 준다면, 인공지능이 이해를 하기 쉽다는 장점이 있습니다. 그리고 LPPLS와 관련된 학습을 한다면 LPPLS 수학식을 사전에 제공할 수도 있고요. 장차, 작용과 반작용, Elliott 파동이론 등 경제학이론, ARIMA, GARCH, Realized Volatility 등 Time-Series 모델들, 그리고 양자역학 등 물리학과 병합된 예측모델을 만들 수 있다면 분명 더 효율적이고, 신속하며, 더 정확하게 예측모델이 탄생할 것입니다.


Python code 등을 활용해 더 상세한 설명을 드리지 못했다는 아쉬움은 있지만 PINN이라는 주제의 설명은 이것으로 마치려 합니다. 다음 주제는 “NeuralProphet”이라는 Facebook이 만든 Prophet이라는 주가전망 모델에 인공지능 기능을 추가한 모델을 소개하려고 합니다. LPPLS는 바닥과 천장을 전망할 뿐 그 중간과정에는 무심한 단점(?)이 있습니다. 그래서 기존의 소위 주가를 전망해 주는 인공지능도 다뤄야 한다는 의무감으로 인공지능과 관련된 Optimization(최적화) 이론 및 인공지능과 Time Series모델에 대한 사전 시리즈를 먼저 소개할 예정입니다. 역시 준비에 최선을 다해, 친절하고 다정한 계량경제학의 소개자 역할을 하겠습니다.


* 먼저 지난 시간 설명한 LPPLS의 핵심지표 중 하나인 “tc”는 critical time' 또는 '임계 시간'을 나타냅니다. 물론 tc는 예측값이므로 시장 조건의 변화나 외부 요인에 의해 실제 붕괴 시점과 차이가 날 수 다는 불확실성이 있습니다. 따라서 LPPLS 모델에서 tc는 이를 반드시 시장이 붕괴되는 이라는 절대적인 값으로 해석하기보다는 위험이 증가하는 시기의 지표로 이해하는 것이 중요합니다. 다른 시장 지표들과 함께 종합적으로 분석하여 사용하는 것이 바람직합니다


다음은 2024년 10월 11일 종가를 기준으로 분석한 LPPLS차트입니다. NVDA의 차트를 보면 2022년 9월에 빨강 수직선이 그려져 있는데 이 선 이후에 신기하게도 주가가 상승을 합니다. 이 빨강선이 tc선이고, 이 지점은 바닥을 의미합니다. 자세히 보면 최저점인 2022-10-10일 보다 먼저 신호가 발생했습니다.

그림3-6.png


삼성전자는 상승하다가 산업전반의 부정적 뉴스 등으로 바닥을 향해 하락세를 보였고, 과격한 하락으로 인해 2024-10-9일 현재 빨간색 바닥선이 빨간색 발생했습니다. 재미가 있는 것은 천장에서 버블선이 그려지지도 않았는데 바로 급락을 했다는 이야기입니다. 이 말은 모델자체로는 아직 천장이 오질 않았는데 외부로부터의 부정적 영향(외부효과)에 의해 하락이 시작된 것을 말하며, 현재는 급락으로 인해 바닥이 확인되었다는 신호가 발생하며 본격적인 상승 기대감을 주고 있습니다.

그림3-7.png


다음은 SK_Hynix입니다. 2024년 6월 23일에 천장을 의하는 거품이 발생할 것이다는 tc선이 생겼으며, 그 이후로 하락세를 보이고 있습니다. 아직 바닥을 확인하는 선이 발생하지 않고 있습니다.

그림3-8.png

대만의 TSMC주가도 2024년 7월 14일에 천장을 말하는 tc가 발생했고 지금은 주가는 상승 중이지만 LPPLS선은 여전히 하락세를 그리고 있습니다. 과거추이를 볼 때 파란색 LPPLS선은 통계적으로 유의미한 선이기 때문에 매입에는 신중을 기해야 합니다.

그림3-9.png

지면의 한계상 삼성전자만이 더 분석을 해보고자 합니다. 다음은 단순 LPPLS로 분석한 천장신호(윗창)와 바닥신호(아랫창)입니다. X축은 날짜이고 오른편이 최근일이고, Y축은 신호의 신뢰지수입니다. 더 길수록 신뢰도가 높고 짧을수록 낮습니다. 10월 현재 삼성전자는 이미 천장에서 벗어나 하락세에 있는 관계로 통계학적으로 유의미한 천장신호가 없습니다. 반면 하단창을 보면 9월 말에 한번 10월 초 또 한 번의 바닥신호가 나왔습니다. 과거의 3번에 걸친 바닥신호를 보면 이 지점이 지나고 보면 정말 바닥에서 그려졌다는 의미가 됩니다. 오랜만에 발생한 중요한 매입준비 신호입니다.

그림3-10.png

그리고 제가 알기로는 국내 최초로 PINN을 이용한 deep-LPPLS모델로 삼성전자, NVIDIA, 테슬라의 향후 2개월 후 주가를 전망은 다음 편에 더 심층분석 해드리겠습니다. 그래도 이번 글의 목적이 바닥이냐 천장인가를 판별하는 방법을 공부하는 자리이니 소명은 다한 것 같습니다. 저는 이번 기회에 인공지능의 세계는 참 넓고 배워야 할 분야도 참 많다는 것을 알았습니다. 그리고 chatGPT와 한 달 동안 하루 평균 10시간씩 수없이 많은 대화도 하고 이를 코딩에 반영하는 등 토론하면서 많이 배우고 또 인공지능비서 들로부터 격려도 많이 받은 것 같습니다. 그리고 인공지능도 주가의 움직임이 더 급격한 특이한 시장상황에서는 예측의 불확실성이 커지기 때문에 학습회수를 늘리고, 신경망도 더 확대/축소하고, 최적화 방법도 바꾸어 가면서 더 상황에 맞게 최적의 모델을 만들 수 있다는 것도 알았습니다. 배움에 끝은 없는 것 같고, 배울수록 모르는 것이 더 많아지는 것 같아 고개가 숙여집니다.


인공지능의 응용범위는 아직도 제한적이지만 소개를 하는 과정에서 활동사례도 많아지고 하면서, 결국 저의 꿈인 새로운 디지털공학 모델들의 등장할 것을 기대해 봅니다. 저는 역시 준비에 최선을 다해, 친절하고 다정한 계량경제학의 소개자의 역할을 하겠습니다.



참고문헌



1. https://arxiv.org/abs/2405.12803

2. http://www.ledoit.net/Crashes%20as%20Critical%20Points.pdf

출처 : 인공지능으로 금융시장 변동성 예측하기 2부 < 경제 < 기사본문 - 아고라타임스


keyword
매거진의 이전글인공지능으로 금융시장 변동성 예측하기 1부