brunch

You can make anything
by writing

C.S.Lewis

by 마경근 Aug 28. 2020

팩트체크, 서울 아파트 가격 10억?_1

Part3. 알짜 공공데이터 활용 05 - 부동산 실거래가 데이터

공공기관에서 제공하는 데이터중 가장 쓸모있다고 생각하는 알짜 데이터를 골라서 활용 방법을 공유한다.

데이터 활용을 설명하기 위하여 Python, QGIS, PowerBI 등 상황에 적합한 도구를 사용한다. 하지만, 공유하고자 하는 핵심은 분석 도구가 아닌 공공 데이터의 이해와 활용이다.

알짜 데이터의 선택 기준은 아래와 같다(순전히 저자의 주관적 기준이다)

가치성 : 데이터는 유의미한 분석 소스로 사용만할만 가치를 가져야 한다(단순 집계성 데이터 배제)

신뢰성 : 데이터의 생성 과정을 논리적으로 이해할 수 있어야 하며 흠결이 없어야 한다.

완전성 : 데이터를 이루는 속성과 값은 누락과 중복이 없어야 한다.

지속성 : 데이터는 일정 주기에 따라 지속적으로 갱신되어야 한다(1회성 데이터 배제)


1. 부동산 거래 계약 신고 제도


부동산 거래 계약 신고제는 부동산을 거래하는 경우, 이중 계약을 방지하고 공정하고 투명한 거래를 위해 부동산의 실제 가격을 신고하는 제도이다. 

부동산 거래 계약 신고는 계약을 체결한 후 30일이내로 이루어져야 하며, 기한을 경과하는 경우 과태료가 부과될 수 있다(2020년 2월21일부터 신고 기한이 60일에서 30일로 단축되었다). 

만일 매수자와 매도자가 직거래 계약을 하지 않고 중간에 중개업자를 통해 진행할 경우, 거래 계약 신고는 중개업자의 의무로 넘어간다.

아래의 서식은 실제 부동산 거래계약 신고서이다.


2. 부동산 실거래가 데이터


여러 공공기관과 민간기업에서 부동산 시세 관련 데이터를 제공하고 있다. 이번 글에서는 국토교통부에서 제공하는 부동산 실거래가 데이터중 아파트 매매 실거래가를 중심으로 소개한다.

부동산 실거래가 데이터는 부동산 거래 계약 신고 제도에 의하여 신고한 거래 내역을 공개하는 데이터이다.

매매 거래 공개 대상은 2006년 1월부터 부동산거래신고 및 주택거래 신고를 한 토지, 주택(아파트, 다세대/연립, 단독/다가구) 오피스텔, 상업업무용 부동산과 2007년 6월29일 이후 체결된 아파트 분양/입주권의 전매거래이다. 

실거래가는 「부동산 거래신고에 관한 법률」 제3조에 따라 거래계약에 대하여 신고의무자가 직접 신고한 실제거래금액을 나타내며, 일반시세는 시장에서 거래 가능한 금액수준으로 다소 차이가 있을 수 있다. 

현재 「부동산 거래신고 등에 관한 법률」 제3조에 따라 계약(체결)일로부터 30일 이내(계약일이 '20.2.21일 전인 경우에는 60일 이내)에 신고를 하도록 규정되어 있어 계약일자와 신고일자는 시차가 발생할 수 있다. 

신고자료는 공개절차상 문제가 없으면 신고 다음날 공개하는 것이 원칙이며 계약일을 기준으로 공개된다.(예시: 7월 계약, 8월 신고건 → 7월 거래건으로 공개)


2.1. 데이터 개요(아파트 매매)

데이터 공개 범위(기간) : 2006년 1월부터 현재까지

데이터 공개 범위(공간) : 대한민국의 모든 시도

대상 범위 : 부동산 거래 계약을 신고한 모든 아파트(2020년 6월 전국 기준,  105,137건)

데이터 기록 단위(시간) : 일(日)

데이터 기록 단위(공간) : 아파트 단지의 주소

업데이트 주기 : 매일

계약일 기준( 7월 계약, 8월 신고건 → 7월 거래건으로  제공)


2.2. 데이터 다운로드

국토교통부 실거래가 공개시스템(https://rt.molit.go.kr)의 실거래가 자료제공 메뉴를 선택한다.

조건별 검색 화면에서 원하는 계약 기간과 대상, 지역 등을 선택하고 다운로드를 클릭한다.

- 2019년8월1일부터 2020년7월31일까지 1년간, 아파트(매매), 서울시 전체를 선택한다.


2.3. 데이터의 이해

데이터는 12개의 속성(열)으로 구성되어 있다. 12개의 속성은 4가지로 유형으로 구분된다.

① 주소 관련 속성 : 시군구, 번지, 본번, 부번, 도로명

   - 시군구에서 동(洞) 단위는 법정동이다.   법정동과 행정동

② 아파트 관련 속성 : 단지명, 전용면적, 층, 건축년도

   - 개인정보 보호를 위하여 아파트 동과 호는 생략하고 가격과 관련있는 층은 공개한다.

③ 계약일 관련 속성 : 계약년월, 계약일

④거래금액 속성 : 거래금액(만원)

2019년 8월1일부터 2020년 7월 31일까지 1년간 매매 건수는 100,120건이다(2020.8.26 다운로드 기준)

계약후 30일 이내 신고를 하면 되기 때문에, 일정 시기까지 매매 건수는 증가할 수 있다. 예컨대, 2020년 7월에 30일에 계약한 물건은 2020년 8월30일까지 신고할 수 있으므로, 필자의 다운로드 시점인 8.26일 이후에 7월의 매매 건수는 증가할 수 있다.



3. 'KB주택가격동향' 데이터와 비교


3.1. 'KB 주택가격동향' 데이터 개요

3.1.1. 조사내용

주택매매 및 전세가격, 주택거래동향 및 주택동향 심리지수, 변동요인

평균 주택매매가격, 평균 주택전세가격, 중위주택가격, 5분위 평균주택가격, 주택가격 5분위 배율 등

3.1.2. 조사 기준일 및 주기

조사주기 : 월 1회

조사기간 : 조사기준일로부터 5일

조사기준일 : 매월 15일이 포함된 주의 월요일

3.1.3 조사방법

표본주택이 거래가 된 경우에는 실거래가격을, 거래가 되지 않은 경우에는 매매(임대)사례비교법에 의하여 조사된 가격을 해당지역 부동산중개업소에서 직접 온라인상 조사표에 입력하는 자계식 조사를 기본으로 하며, 온라인 조사가 불가능한 부동산중개업소에 한하여 조사원이 전화 또는 팩스로 조사함

3.1.4. 조사 모집단

아파트 : 통계작성지역으로 선정된 전국 153개 市ㆍ郡ㆍ區의 모든 아파트 세대 중 표본설계 당시 관련 정보를 얻을 수 있는 아파트 세대

3.1.5. 표본 설계 

아파트 표본 추출방법 : 층화 2단 집락 확률비례추출법            

    - 층화변수 : 각 지역(구/군/시), 전용면적(대/중대/중/중소/소) 

          - 집락 : 각 전용면적별 아파트 단지 

          - 추출방법 : 아파트 단지를 세대수 크기 기준 확률크기비례추출(pps sampling)한 후 단지 내에서 상위평균가, 하위평균가, 일반평균가의 세대를 추출

3.1.6. 지수를 보는 방법

지수의 기준시점 : 2019년 1월 (2019.1 = 100.0)

지수의 변동률          

    - 전월비(%) : 전월과 비교한 금월의 가격수준 변동률 = [(금월지수-전월지수)/전월지수]*100

    - 전년동월비(%) : 전년동월과 비교한 금월의 가격수준 변동률 = [(금월지수-전년동월지수)/전년동월지수]*100


3.2. 'KB 주택가격동향' 데이터 다운로드

KB주택은행 LiivON 사이트(https://onland.kbstar.com)에서 뉴스/자료실 > 통계/리포트 > 월간 KB주택가격동향 메뉴를 선택하고, ★시계열 자료 2020년 7월 기준 (1986년 1월 부터)를 클릭하면, 데이터를 다운로드할 수 있다.


데이터는 엑셀 시트로 구성되어 있으며, 1986년 1월부터 최근까지의 아파트 매매가격지수를 확인할 수 있다.

지수 기준시점 : 2019년 1월 = 100.0 (2019년 1월 부터 표본 변경 확대 적용, 지수 기준시점 변경)


3.3. 데이터 비교 및 활용

3.3.1. 데이터 비교

국토교통부의  '부동산 실거래가' 데이터는 매매가 발생한 부동산 물건의 거래 내역을 기록한 데이터이다. 실제의 거래 사실을 기록한 데이터로 의미가 있으나, 시점별로 동일한 지역의 동일한 물건 거래 데이터를 확보할 수 없다는 단점이 있다.

KB주택은행의 'KB주택가격동향' 데이터는 표본조사 방법에 의하여 전체 부동산가격의 변화를 추정한 데이터이다. 시계열 방법으로 전반적인 부동산가격 변화 추이를 파악할 수 있으나, 개별 부동산의 실제 가격 변화를 정확하게 파악할 수 없는 한계가 있다. 


3.3.2. 데이터 활용

'부동산 실거래가' 데이터는 개별 아파트의 거래 가격을 정확하게 기록하지만, 매월 동일한 지역의 동일한 아파트가 거래된다는 보장이 없으므로, 시계열 데이터로 활용하기에 부적합하다. 특정 시점, 특정 지역, 특정 아파트의 거래 가격을 파악하는 용도로 활용하는 것이 바람직하다.

반면에  'KB주택가격동향' 데이터는 전반적인 부동산가격 변화 추이를 파악할 수 있는 시계열성 데이터로 아파트 가격 변화를 나타내는 지수로 사용하는 것이 바람직하다.

결론적으로 두개의 데이터는 대체재가 아닌 상호 보완재써, 전반적인 아파트 가격 동향 파악과 관심있는 특정 아파트의 가격 상황을 파악하기 위한 수단으로 활용 가능하다. 



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari