brunch

You can make anything
by writing

C.S.Lewis

by 홍창수 May 14. 2021

 퀀트모델링 A to Z

(1)회귀분석(2)HP필터(3) 벌점 회귀분석 (4) 로지스틱회귀

[삼성증권] 퀀트모델링 A to Z (1) 회귀분석


• 다양한 퀀트 모델링 기법에 대해 이론 설명과 구체적인 사용법을 설명할 계획 

• 회귀분석 모델에 대한 설명 및 사용 방법 수록


# 우리는 이번 기획을 통해서 자산 운용에 도움이 되는 여러가지 모델링 방 법을 설명하고,예제를 통한 구체적인 사용법 또한 전달하려고 한다 . 본 기획은 기초적인 회귀분석 모델부터 출발하여 10 여가지 이상의 시리즈로 발간할 계획이다


회귀분석은 독립변수들과 종속변수의 선형관계를 분석한다 . 일반적으로 회귀분석 모델은 1) 단순 선형 회귀분석 모델 (simple linear regression 과 2) 다중 회귀분석 모델(multiple regression)을 지칭한다. 회귀분석 모델은 단순하다고 여겨진다 . 하지만, 기본 회귀분석은 로짓(logit), 프로빗(probit) 모델 혹은 머신러닝 기법으로 이야기되는 Ridge 회귀, Lasso 회귀 등의 이론적 기초가 되므로 원리를 이해하는 것이 필요하다.



엑셀에서의 사용법 , 파이썬에서의 사용법 수록


퀀트모델링 A to Z (2) HP필터


• HP 필터에 대한 설명 및 사용 방법 수록


우리는 이번 퀀트 모델링 A to Z 기획을 통해서 자산 운용에 있어서 유용한 여러가지 모델링 방 법을 설명하고 , 예제를 통한 구체적인 사용법 또한 전달하려고 한다 . 본 기획은 기초적인회귀분석 모델부터 출발하여 10 여가지 이상의 시리즈로 발간할 계획이다 지난 회귀분석 편에이어 이번 편에서는 HP 필터를 설명한다 . 이번 HP 필터는 , 회귀분석과 같은 선형 필터에서 확장된 비선형 필터 기법의 한 가지로 이해할 수 있다. 


HP 필터 (Hodrick Prescott 필터) , 호드릭 프레스콧 필터는 거시경제 시계열 데이터에서 장기적인 추세 (Trend Component 와 단기적인 순환(Cyclical 을 기술적으로 분리하는 기법이다 . 보통 필터라 함은 원 데이터에서 노이즈를 제거 하는 기법을 말한다 . 종목 분석에서 흔히 사용하는 이동평균법도 필터의 한 종류다 . 필터는 경제학적 이론을 바탕으로 하는 모델이 아니라 , 통계적 특성만을 활용하여 추세나 순환 정보를 추출하는 방식이다.



엑셀에서의 사용법 , 파이썬에서의 사용법 수록


기계학습과 투자전략


 기계학습(Machine Learning)은 주식투자분야에서도 활용될 수 있다. 주식시장에는 수많은 데이터들이 존재한다. 매일 매일 주식시장에 대한 뉴스기사가 나오며, DART(전자공시시스템)에도 매순간 주식들의 공시정보가 올라온다. 각 주식의 여러가지 펀더멘털 수치데이터도 항상 조회할 수 있다. 이런 다양한 데이터들을 Machine Learning을 통해 자동학습하여 패턴인식 및 예측에 활용한다면, 자동화된 주식투자모델을 만들 수 있다. 최근 증권업계에서이야기되는 로보어드바이저서비스에서도 기계학습알고리즘이 일정부분의 역할을 하고있다.


Naive Bayes Classifier 소개 및 모델제시


 나이브베이즈분류기는, 기계학습의한분야로서, 특정자료가 여러가지속성을 가지고 있을 때 해당자료를 어느분류(Class)에 넣어야 할지를 베이즈 정리를 활용하여 판단해주는 알고리즘이다.




랜덤 포레스트 기법을 활용한 머신러닝 기반 모델


본 자료는 먼저 머신러닝 기법인 결정 트리와 랜덤 포레스트의 이론과 사용방법을 설명한다. 그리고, 랜덤 포레스트 기법을 활용하여 코스피를 단기 예측하는 AI 모델을 소개하고 이에 대한 정보를 제공한다. 결정트리(Decision Tree, 의사결정나무라고도 함)는, 나무 형태의 판단 규칙 조합을만들어서 기존 데이터를 학습하고 그 다음에 예측하는 알고리즘을 말한다. 쉽게 생각하면 어렸을 적의 ‘스무고개’ 놀이와 같은 개념이다.앞서 언급한 ‘결정 트리’ 모델에 배깅(bagging) 기법을 적용한 앙상블 모델을, 특별히 ‘랜덤 포레스트’ 모델이라고 한다. 하나의 데이터 소스에서 랜덤하게 데이터들을 만들어 여러 개의 학습된 결정 트리 모델을 만들고 이를 종합하는 방식이다.



퀀트모델링 A to Z (3) 벌점 회귀분석


• Ridge, LASSO, Elastic Net regression 대한 설명 및 사용 방법 수록


Penalized Regression(벌점 회귀 ) 혹은 Regularized Regression( 규제화 회귀 라는 것은 , 회귀분석 방법의 일종으로 회귀계수 축소를 통해 모형의 과적합을 피하려는 기법을 말한다. 벌점화 란 회귀계수 값의 과잉에 대해서 벌점을 준다는 의미로 , 회귀분석식의 회귀계수 해를 찾을 때 , 벌점화 조건이 추가된다는 뜻이다. 구체적인 방법에 따라 Penalized Regression 에는Ridge, LASSO, Elastic Net 등의 방식이 존재한다 파이썬의 머신러닝 패키지인 sklearn 에서 Ridge, Lasso, ElasticNet 클래 스를 통해 해당 모델들 을 손쉽게 사용할 수 있다



퀀트모델링 A to Z (4) 로지스틱회귀


• Logit 모델 Logistic Regression 모델 에 대한 설명 및 사용 방법 수록


이번편에서는 지난 ( 회귀분석과 (2)HP 필터 , (3)Penalized Regression 에 이어 Logit 모델 (Logistic Regression 모델 을 다룬다 . Logit 모델은 특정 이벤트가 발생할 확률을 모델링 하고 범주 분류 (classification) 작업을 수행하는 기법이다 . Logit 모델은 0 또는 1 의 값만 취하는 이분적 데이터와 [0,1] 사이인 확률 데이터의 분석과 결과 해석에 용이하다.이름처럼 Logit 모델은 로지스틱 분포 (Logistic distribution, 혹은 Sigmoid function) 를 이용 하여 모델 에서 추정된 이벤트별 확률이 항상 [0,1] 사이에 놓이도록 한다. 분석자는 이 추정된 확률을 바탕으로 임계치에 따라 범주를 분류할 수 있다 .



퀀트모델링 A to Z (5) 

포트폴리오 밸류에이션 계산법

(가중 조화평균)


포트폴리오의 PER, PBR 등 밸류에이션 지표 계산 시, 가중 조화평균을 활용하는 것

이 편리함(PER, PBR 등 가격이 분자에 있는 상대 밸류에이션 지표)

 유동시가총액 가중 방식의 일반적인 주가지수에서도, 가중 조화평균을 사용해야 정

확한 합산 지표 산출이 가능함



[새책소개] 퀀트의 세계 - 금융 데이터과학자를 위한 퀀트실무·취업가이드


https://brunch.co.kr/@gauss92tgrd/61


작가의 이전글 향후 금융권 주요 분석도구는 “엑셀+파이썬”이 된다.
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari