brunch

You can make anything
by writing

C.S.Lewis

by 이유민 Mar 16. 2022

고양시 아파트 실거래가 분석 1편

고양시 아파트 실거래가 분석 (R과 위치데이터를 활용한)

1. 분석배경


고양시가 1기 일산 신도시, 3기 신도시 등으로 인해 최근 큰 이슈인 것 같아요. 일산서구, 일산동구 지역은 1기 신도시로서, GTX건설 등으로 최근 집값이 오르는 추세다.  3기 신도시가 건설되는 덕양구, 삼송 부근은 3기 신도시 확정의 여파로 최근 아파트 가격이 주목받고 있는 걸로 알고 있어, 필자는 고양시 아파트 실거래가를 R로 분석했다. (성균관대학교 2021-1학기 위치데이터분석 강의의 기말과제 중 일부 발췌해 브런치 글을 작성합니다)


2. 분석주제


1. 고양시의 아파트가격(실거래가)는 어떤 요인에 의해 영향을 받는지 분석한다. 

2. 2020~2021년 5월까지 어떠한 요인이 고양시 아파트 실거래가에 영향을 미치는지 분석한다.  (요인 : ‘단위면적’, ‘층’, ‘건축년도’ )

3. 추가로 법정동에 따라 아파트 실거래가가 달라지는지도 분석한다. 

4. 단지별로도 아파트 실거래가의 평균을 지도로 시각화하고 분석한다.


3-1. 데이터 수집 


•데이터 기본내용 : 2020~2021년 5월까지 아파트 실거래가 데이터 중, 고양시 3개 구 (일산서구, 일산동구, 덕양구 ) 

•출처 :  공공데이터 포털 – 국토부 아파트 실거래가 api 

(참고) 국토교통부_아파트매매 실거래자료 | 공공데이터포털 (data.go.kr) 

•데이터 수집방법 : 국토부 아파트 실거래가 api 를 R에 불러와서 수집함

•분석도구 : R

•데이터 크기 : 총 28653행, 13개 열 (거래금액, 건축년도, 년, 법정동, 아파트,  월, 일, 전용면적, 지번, 지역코드, 층, 해제사유발생일, 해제여부)


3-2. 데이터 전처리


•고양시 3개 구 데이터 병합 (일산서구+일산동구+덕양구)

•숫자 데이터를 회귀분석가능한 ‘숫자’(numeric)데이터로 변환

•문자열을 factor로 변환거래금액 그룹을 새로 지정 (거래금액의 그룹별로 거래량을 파악하기 위해)


4. 분석 가이드


•국토교통부 아파트 실거래가 자료를 통해 API를 R을 통해 불러왔다

•QGIS에서 고양시 지역에 해당되는 구 (고양시 덕양구, 고양시 일산서구, 고양시 일산동구) 의 코드를 찾아서 해당지역의 2020~2021년 5월까지 데이터를 수집한다

•Summary 함수를 이용해 대략적인 기술통계량을 분석한 뒤, 분석할 요인들을 정한다.

•R에 시각화에 사용되는 ggplot을 통해 시각화를 진행한뒤, 회귀분석을 하여 거래금액과 다양한 요인과의 상관관계를 도출해낸다.

•다양한 수치적 요인과 함께 위치와 관련된 데이터 분석을 위해 지도 시각화와 법정동별 거래금액을 분석한다

•최종적으로  거래금액에 영향을 미치는 다양한 요인과 함께 법정동을 제시함으로써 아파트 구매 가이드라인을 제시한다


5. 기본적인 데이터 분석


R로 데이터의 기본분석을 돌린결과! 기술통계량


•거래금액은 5천 8백만원이 최소거래금액이었으며, 중간 값은 3억 5천만원, 중위 값은 4억 2백30만원, 최대거래금액은 30억으로 보여진다.

•건축년도는 1983년이 가장 오래된 아파트로 거래되었으며, 2020년 가장 최신의 아파트까지 거래된 것으로 보인다.

•덕양구 (41281)가 10529건, 일산동구 (41285) 6905건, 일산서구 11254건으로 덕양구>일산서구>일산동구 순으로 많다. 

•법정동은 덕양구 행신동, 일산동구 탄현동, 일산서구 주엽동, 덕양구 화정동, 일산동구 중산동 순으로 거래가 많이 이루어졌다.

•일산두산위브더제니스 아파트가 가장 거래량이 많으며 샘터마을2, 큰마을 대림,현대아파트, 소만마을 (성원)6, 일산요진와이시티, 햇빛주공23순으로 거래량이 많다.

•전용면적은 중간값이 84.39, 평균값이 82.34이며 가장 작은 값이 14.06 가장 큰 값이 244.36이다.층 수는 중위값이 9층, 평균이 10층이며 가장 높은 거래된 층은 59층으로 드러난다. 

•덕양구 (행신동, 화정동) 삼송 등 3기 신도시에 따른 영향력으로 거래량이 많은 것으로 추측된다.

•일산서구 (주엽동) 가 그 다음으로 많은 이유는 일산신도시 건설의 핵심 축이었으며 GTX (대화역, 일산역)과 후곡 학원가등 학군에 따라서도 거래량이 많은 것으로 추측된다.

•일산동구(탄현동,중산동)은 탄현역 등의 입지로 인해 일산두산위브더 제니스가 1035건으로 전체 거래량의 20%정도로 특정아파트에  많은 영향을 차지하고 있는 것으로 보인다.










작가의 이전글 2021년의 회고1 : 학교수업
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari