brunch

You can make anything
by writing

C.S.Lewis

by 히말 Sep 19. 2021

KB 아파트 매매지수(21.9.20)
머신러닝 예측

이제부터 다기간 예측 모형으로 갑니다

1. 지난 주 복기


일단 지난 주 예측치가 얼마나 맞았는지 살펴보겠습니다.

전국 지수는 126.91을 예측했고, 실제로는 126.95가 나왔습니다. 조금 빗나갔군요.

서울은 예측이 132.10이었는데 실제 지수는 132.03였습니다. 역시 약간의 오차가 있었습니다.


강남은 129.97 예측에, 실제는 129.96. 거의 정확하군요.

6대 광역시는 124.95를 예측했고 실제 지수는 124.93이었습니다. 역시 거의 정확한 예측.

부산은 예측치가 122.16였는데 실제 지수는 122.21. 봐줄만 합니다.


대전은 139.20 예측, 139.23 실제. 거의 정확.

울산은 116.33 예측, 116.21 실제. 조금 차이나는 군요.

수도권은 137.23 예측, 137.27 실제. 봐줄만 합니다.



2. 알고리즘 조정


알고리즘에 변화를 줬습니다. 여러 가지로 실험을 해봤지만, 다기간 예측 결과 오차가 너무 심하고, imputing에 시간이 너무 많이 걸려서 모형을 단순화했습니다. 예측 성능은 비슷하니, 조금 더 최적화되었다고 보면 되겠습니다.


일단 다기간 예측이 가능하도록 바꾸기는 했습니다만, 다기간 예측의 정확도는 아무래도 불안합니다.

다음 번 지수를 예측한 다음, 그걸 데이터 셋에 포함시켜서 다시 또 그 다음 번 지수를 예측하는 방식이기 때문이죠.

한 걸음씩 걷는 방식이라고 보시면 되겠습니다.

그래서 모형 자체는 10년이든 100년 후든 예측이 가능합니다.

다만 그렇게 해서 나온 예측값을 믿을 이유는 별로 없겠죠.


재미 삼아 100년 후에 전국 아파트 매매지수가 어떻게 되는지 돌려본 결과는 다음과 같습니다. (100년 뒤에 아파트가 있으려나?)



3. 다음 주 예측


전국 지수는 0.43% 상승해서 127.50 예상해봅니다.

서울은 0.37% 상승해서 132.52,

서초구는 0.39% 상승해서 123.81 예상합니다.



노원구는 0.61%나 상승하는군요. 149.72 예상합니다.

경기도도 0.57%나 상승해서 141.58을 달성한다는 예측이 나왔습니다.

부산은 0.33% 상승, 122.61이 된다고 합니다.



부산의 대장 지역, 해운대구는 0.48% 상승해서 150.12 예상합니다.

요즘 날아다니는 동두천은 0.94% 상승이라는 폭등세를 이어갑니다. 134.88 예상합니다.


청주 서원구 역시 요즘 날아다니는 중인데요, 1.32% 하락이라는 대폭락이 예측되었습니다. 


이건 믿기 어렵군요. 뜯어보니 원 데이터에 문제가 좀 있습니다. 

KB 데이터를 살펴보면, 시작지점인 2008년부터 무려 2016년까지 113.5라는 숫자로 도배를 해놨습니다.

데이터가 없으면 그냥 빈칸으로 놔둘 것이지, 왜 이상한 값으로 도배를 해놨는지 이해가 잘 안 되네요.

(이게 그냥 빈칸이었다면 iterative imputer로 상당히 괜찮은 예측값을 채울 수 있고, 그렇게 하면 이상한 값으로 도배를 한 경우보다 훨씬 괜찮은 결과가 나옵니다.)

그냥 빈칸이 싫은 모양입니다.



현재 KB 데이터에서 유이하게 매매가가 하락 중인 두 지역, 목포와 세종입니다.

두 도시 모두 다음 주 0.01%의 소폭 반등을 예상합니다.

목포의 경우 그럴 수도 있겠습니다. 원데이터가 이상해 보이지는 않거든요.


그러나 세종시의 예측은 신뢰하기가 어렵습니다.

청주 서원구와 마찬가지로, "쓰레기를 넣으면 쓰레기가 나오는(GIGO)" 문제가 여기에도 적용됩니다.

원 데이터를 뜯어보면, 세종시의 경우 2013년 4월까지 93.3이라는 이상한 값으로 도배를 해놨습니다.

청주 서원구와 마찬가지로 그냥 빈칸이 싫어서 이상한 값으로 도배를 한 거죠.


다양한 지역들을 살펴봤는데요, 다음 주에 얼마나 맞았는지 점검해 보면 재미있겠습니다.



작가의 이전글 KB 아파트 매매지수(21.9.6) 머신러닝 예측
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari