10일조
방학 때 공부하고 싶은 애들이 있는지 물어봤다. 가장 큰 이유는 학점에 구애받지 않고 advanced course를 경험해 볼 수 있게 해주는 거였다. 작년에는 인공지능 기초, 시계열 이렇게 했었는데, 이번에는 좀 더 체계적으로 갈까한다. 패널 데이터를 하고, 그 다음에 시계열하고, 그 다음에 여력이 되면 시계열 관련 ai 방법론들에 대해서 이야기할까 한다.
패널 그러면 막 어려워들 하는데, 난 아주 개념적인 것부터 시작한다.
ols 를 하는데 자료가 부족해 그래서 옆 지역의 자료들을 막 가져와서 한꺼번에 같이 돌렸어. 그 때 지역별로 계수 차이가 존재하지 않는다고 가정하면 알고 싶은 모수의 갯수는 한 지역만 대상으로 할 때하고 똑같겠지? 이게 pooled ols 야. panel의 가장 기초적인 형태이지.
그러면 각 지역별로 자료를 가져왔으니깐 기존 방식대로 하면 각 지역별로 ols 를 하는 것과 같겠지. 이러면 각 지역별로 각각 모수를 추정해야 할 테니깐 추정해야 할 모수가 엄청 많아질거야. 이게 바로 SUR (seemingly unrelated regression) 이야. 여러 지역을 한꺼번에 돌리는데 지역별로 모수가 다르다고 가정해서 마치 각각 돌리는 효과가 나는거.
이게 panel의 양 극단이고, 대부분의 패널 모델은 이 사이 어딘가에서 결정이 돼. 그 중에 FE (Fixed effect) 하고 RE (Random effect) 가 가장 널리 쓰이는 대표적인 모델이야.
이게 내가 쓰는 인트로다. 난 큰 그림을 그려주고, 조금 더 세부적인 그림을 그려준 다음에, 마지막으로 디테일을 설명해 준다. 그리고 나서 다시 큰 그림을 가져와서 마무리를 한다.
매번 이 원칙을 지키는게 어렵다. 시간도 많이 들고. 그래도 내가 사용할 수 있는 시간의 일부는 공짜로 제공하려고 한다. 내 삶의 여유를 위해서 그리고 삶의 이유 때문에.