brunch

You can make anything
by writing

C.S.Lewis

by 김홍시 Jun 03. 2023

1. 공간데이터가 뭐예요?

'공간데이터'가 생소한 당신을 위한 공간데이터 소개서

#공간데이터

#GIS (지리정보과학)

#빅데이터 분석

0. 들어가며


안녕하세요, 공간빅데이터분석 전문가 김홍시입니다.


우리는 바야흐로 '빅데이터' 시대에 살고 있습니다.

기업이나 기관 뿐만이 아니라 개개인 또한 엄청난 양의 데이터를 직접 생산해내고 있는 요즘입니다.


그런데 이 데이터 중 상당수(60% 이상)가 위치정보를 포함하고 있는 공간데이터라고 합니다. (Hahmann and Burghardt 2013, https://www.researchgate.net/publication/262245536_How_much_information_is_geospatially_referenced_Networks_and_cognition)


공간데이터(spatial data)는 현실의 지리를 디지털로 재현한 결과물입니다. geographically referenced information(지리참조정보)은 어떠한 데이터가 실제 어딘가의 위치를 담고 있음을 말해요.


그런데 공간데이터는 일반 데이터와는 달리 가공 및 분석을 하는 방법이 조금 다른데요,

따라서 공간데이터를 제대로 가공 및 활용하지 않는다면, 우리가 이용 가능한 정보 중 많은 부분을 잃어버리는 거라 할 수 있습니다.


저에게 있어서 공간데이터는 하나의 인문학입니다.
물론 공간데이터 분석에는 다양한 기술적인 지식이 필요합니다. 하지만 저는 공간데이터를 통해 사람의 의도 및 행동을 파악할 수 있으므로, 사람에 대한 깊은 이해를 할 수 있는 인문학이라 생각합니다.

 
공간데이터 분석을 통해서 우리는 아주 다양한 것들을 할 수 있습니다.

공간데이터로부터 유의미한 인사이트를 도출하면 기업의 영업에 쓰일 수도 있고, 지자체의 행정 정책 등에 활용할 수도 있습니다. 또 우리들이 즐겨하는 게임에도 공간데이터가 쓰이고, 다양한 위치기반 서비스를 제작할 수도 있습니다.

 

세상을 입체적으로 보는 방법은 바로 공간데이터가 들려주는 이야기에 귀 기울이는 것입니다.

저는 앞으로 업로드할 "공간데이터 시리즈" 글을 통해, 비전공자 및 일반인들에게도 이 공간데이터의 매력을 전달할 수 있도록 하고자 합니다.




1. 공간데이터란?


1) 공간(space, 空間)

'공간데이터'가 무엇인지 알기 위해서는 '공간'이 무엇인지부터 먼저 살펴보는 게 필요하겠습니다.

위키피디아에서는 '공간'에 대해 철학적/수학적/물리적/공간측량/지리학적 정의를 설명하고 있습니다.

https://en.wikipedia.org/wiki/Space


요약해보자면 공간이란, "어떤 물질 또는 물체가 존재할 수 있거나 어떤 일이 일어날 수 있는 장소"입니다.


2) 공간데이터 (spatial data)


어떤 데이터가 공간에 대한 정보를 담고 있으면 이는 곧 공간데이터가 됩니다.

'공간데이터'란, 특정 지리적 위치 또는 영역과 관련된 데이터를 나타냅니다. 공간 속에서 물체나 현상의 위치/ 모양/속성에 대한 정보를 포함합니다.

특히 지리 정보 시스템(GIS) 등을 활용하면 공간 데이터를 표현하고 분석할 수 있습니다.

 

인간은 공간 밖에서 살아갈 수 없기 때문에, 인간과 공간은 뗄레야 뗄 수 없는 불가분의 관계라 할 수 있습니다. 따라서 공간데이터의 활용 분야 또한 무궁무진하다고 할 수 있겠습니다.


공간데이터의 범위는 어떻게 될까요?

공간이라 하면 굉장히 범위가 넓습니다. 지상이든 지하든, 실외든 실내든, 지구 상이든 우주 공간이든 다양한 형태의 공간이 존재합니다.

공간에 다양한 유형이 있기 때문에 당연히 공간데이터에도 다양한 형태가 있습니다.




2. 공간데이터의 활용 분야


공간데이터의 활용 분야를 알아보겠습니다.


1) 지도


아마 많은 분들이 공간데이터 하면 지리학과 지도를 떠올리실 거 같습니다.

실제로 GIS(지리정보과학)으로 공간데이터를 활용하여 다양한 목적의 지도를 제작할 수 있습니다.


특히 과거에는 종이지도를 썼지만 그 이후 디지털 지도가 등장하면서 많은 변화가 나타났습니다.

범위와 축척을 자유롭게 바꿀 수 있게 되었고요, 또 다양한 공간데이터를 추가하여 중첩시킬 수 있게 되었습니다.

앞으로는 3D지도의 등장으로 한번 더 큰 변화가 있을 것으로 보입니다.


좌 : 종이지도 예시 (구글 검색 갈무리) / 우 : 디지털 지도 예시 (네이버지도 화면 갈무리)
3D 지도 예시 https://mediahub.seoul.go.kr/archives/1287252


2) 지도 기반(Map-Based) Game in GIS


출처 : https://www.eurogamer.net/acclaimed-city-builder-cities-skylines-getting-the-virtual-reality-treatment-in-cities-vr / https://ag.hyperxgaming.com/article/10654/all-maps-levels-and-minigames-in-fall-guys-ultimate-knockout / https://img.khan.co.kr/news/2014/11/18/l_2014111801002608200198091.jpg / https://play-lh.googleusercontent.com/j-VBPRuRdeJTXLreH8U-P8CTNLqqz4JSzVhs-KTe2b_BiwrknuNG7MxK0BzkC1VfeGQ=w526-h296-rw


리그오브레전드, 배틀그라운드, 시티즈스카이라인, 폴 가이즈 네 가지 게임의 공통점은 바로 맵 기반의 게임이라는 것입니다. 게임의 지도를 제작할 때도 공간데이터가 쓰인다고 할 수 있겠네요.


좌 : https://www.sisaon.co.kr/news/articleView.html?idxno=52472 / 우 : 포켓몬고 웨이페러 검색 결과

포켓몬고 또한 공간정보를 활용합니다.

특히 포켓몬고의 경우 게임 내의 '포켓스탑'이 개인 이용자가 신청을 한 후 심사를 받는 방식으로 이루어지기 때문에 사용자 참여형 공간데이터라고도 할 수 있겠네요!


3) 4차 산업혁명의 필수품 (자율주행, UAM 드론, 디지털 트윈, 스마트시티)


공간데이터는 4차산업혁명 관련 다양한 산업에 쓰이는 인프라가 되어줍니다.

자율주행, UAM(드론), 디지털 트윈, 스마트시티 등의 산업에는 공간데이터가 반드시 필요합니다.


- 자율주행과 고정밀도로지도 (HD MAP, High Definition Map)

자율주행을 위해서는 고정밀도로지도가 필요합니다.

사람을 위한 지도인 내비게이션과는 달리, 고정밀도로지도는 자율주행차가 활용하는 지도입니다. 차선, 신호등, 표지판 등의 도로환경 및 상태 대한 정보를 담고 있습니다.


- 디지털 트윈

실제 도시의 모든 측면을 디지털 환경으로 모델링하는 개념입니다. 디지털 트윈은 현실 도시와 거의 동일한 구성 요소를 갖추고 있으며, 실제 도시에서 발생하는 데이터를 수집하고 분석하여 디지털 플랫폼에 반영합니다. 3D 모델링이 가능합니다.


- 스마트시티

현대 도시에서 정보통신 기술과 인프라를 활용하여 효율적이고 지능적인 도시를 구축하는 개념을 말합니다. 이러한 도시는 다양한 기술과 데이터를 활용하여 시민들의 삶의 질을 향상시키고 도시 운영을 효율화하는데 주력합니다.

실내공간정보는 건물, 복합시설물의 실내공간을 3차원으로 현실과 똑같이 구축하여 현장에 방문하지 않더라도 실내 대한 정보 검색이 가능합니다. 실외공간정보와 실내공간정보가 모여 스마트시티의 구현이 가능합니다.


- 드론(UAM) 

드론을 통해 일반인들도 공간정보 구축이 가능하게 되었습니다. 라이다(LiDAR)와 함께 활용합니다.


- 이외에도 해저지형, 산림 등 다양한 공간에 대해 정보를 구축하기도 합니다.



4) 보건 부문


보건 부문에는 크게 역학(疫學)과 보건 시설 입지 선정 등에 이용될 수 있습니다.


- 역학(전염병 관리)

전염병은 공간적인 특성을 가지고 있기 때문에 공간정보 시스템을 활용하여 전염병의 유행 경향을 분석하고, 감염병의 발생 및 확산 패턴을 예측할 수 있습니다. 이를 통해 보건 당국이 예방 및 대응 전략을 수립하고, 효과적인 재난 대비를 하는 데 도움이 됩니다.


존 스노우의 콜레라 오염 지도(런던)


- 보건 시설 입지 선정

공간데이터를 활용하여 의료 시설의 위치를 결정할 수 있습니다.

인구 분포, 거주 지역의 특성, 건강 서비스 접근성 등을 고려해서 보건 혹은 의료 시설의 최적 위치를 결정하면 시민들의 건강 서비스 이용이 향상되고 응급 상황에 대한 대응이 높아집니다.


5) 행정 부문


- 국토 계획 및 도시 개발

공간 데이터를 분석하여 토지 이용 계획을 수립하고, 도시 개발을 지원하는데 활용됩니다.

인구 분포, 교통 인프라, 자연 환경 등 다양한 지리적인 요소를 고려하여 효율적이고 지속 가능한 도시 계획을 수립할 수 있습니다.


- 통계 및 인구 조사

지역별 인구 밀도, 인구 구성, 경제 활동 등의 통계 정보를 지도 상에 시각화하여 분석하고, 정책 수립 및 예산 할당에 활용할 수 있습니다.

일반적으로 통계청에서 제공되는 통계자료는 행정구역별로 구축되는 것이 일반적입니다. 따라서 지역별 통계 자료 또한 공간데이터라고 할 수 있겠습니다.


좌 : 통계청 자료 (kosis.kr) / 우 : 통계청 SGIS 자료 (sgis.kostat.go.kr)


- 선거 구역 설정

선거 구역 설정은 공정한 선거를 위해 필수 요소인데요, 입맛대로 선거구를 설정하는 경우에 게리맨더링 문제가 발생할 수 있습니다.

게리맨더링이란 특정 후보자의 당선을 유리하게 하거나 특정 정당이 더 많은 의석을 확보하도록 선거구를 지리적인 구역과 다르게 기형적인 모양으로 분할하는 것을 말합니다.

공간데이터를 활용하면 인구 밀도, 거리, 지리적인 특성 등을 고려하여 선거 구역을 설정할 수 있습니다.


위키백과 '게리맨더링' 검색 결과 https://ko.wikipedia.org/wiki/%EA%B2%8C%EB%A6%AC%EB%A7%A8%EB%8D%94%EB%A7%81



6) 부동산 부문


- 부동산 시장 분석: 부동산은 공간적인 특성이 매우 중요합니다. 공간정보 시스템을 활용하여 부동산 시장 동향을 분석하고, 지역별 가격 변동, 수요-공급 균형 등을 파악할 수 있습니다. 이를 통해 투자자와 시장 참여자들은 합리적인 결정을 내릴 수 있습니다.


- 부동산 투자 분석: 부동산 투자자는 공간정보를 활용하여 투자 가능성을 평가합니다. 지리적 분석을 통해 인구 밀도, 교통 편의성, 시설 접근성 등의 요소를 고려하여 부동산 투자의 잠재적 가치를 평가합니다.  



아파트 실거래가 분석 및 가공 사례

사진은 아파트 실거래가 분석 및 가공 사례입니다.

이와 관련하여 자세한 정보가 필요하신 분은 아래 두 개의 링크를 참고하세요.

https://kimhongsi.tistory.com/entry/%EB%B6%80%EB%8F%99%EC%82%B0-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B3%B5%EB%8F%99%EC%A3%BC%ED%83%9D-%ED%86%B5%ED%95%A9-%EB%A7%A4%EB%A7%A4-%EC%8B%A4%EA%B1%B0%EB%9E%98%EA%B0%80%EA%B2%A9%EC%A7%80%EC%88%98-KOSIS


https://kimhongsi.tistory.com/entry/Python-API%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%95%84%ED%8C%8C%ED%8A%B8-%EB%A7%A4%EB%A7%A4-%EC%8B%A4%EA%B1%B0%EB%9E%98%EA%B0%80-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B5%AC%EB%93%9D






이 외에도 다양한 부문에 공간데이터가 사용될 수 있습니다.



3. 공간데이터의 유형 : 벡터와 래스터

공간정보를 표현하는 데 사용되는 두 가지 주요 데이터 형식에는 벡터 데이터와 래스터 데이터가 있습니다.


1) 벡터 데이터


벡터 데이터에는 점, 선, 면 세 가지의 유형이 있습니다.


- 점(Point): 벡터 데이터에서 가장 기본적인 형태로, 지리적인 위치를 나타냅니다. 점은 좌표 (경도, 위도 또는 x, y)로 표현되며, 개별적인 위치를 나타내는 지점을 나타냅니다. 예를 들어 도시의 위치, 강의 출발지점 등이 점으로 표현될 수 있습니다.


- 선(Line): 두 개 이상의 점을 연결하여 형성된 선분을 나타냅니다. 선은 길이와 방향을 가지고 있으며, 경로, 도로, 강 등과 같은 지리적인 특성을 표현할 수 있습니다. 도로 네트워크, 하천, 해안선 등이 선으로 표현될 수 있습니다.


- 면(Area): 선으로 둘러싸인 영역을 나타내며, 폴리곤이라고도 불립니다. 면은 점과 선을 이용하여 생성되는 폐쇄된 도형으로, 지리적인 영역을 나타냅니다. 주택 구역, 도시 경계, 공원 등과 같은 지리적인 영역을 면으로 표현할 수 있습니다.


https://www.earthdatascience.org/courses/use-data-open-source-python/intro-vector-data-python/spatia



2) 래스터 데이터


래스터 데이터는 공간 정보를 그리드 형태로 표현하는 데이터 형식입니다.

이미지, 지형 데이터, 위성 사진 등과 같은 연속적인 데이터를 표현하기에 적합합니다.


- 그리드 형태: 래스터 데이터는 공간을 정사각형 또는 직사각형 그리드로 분할하여 표현합니다. 이 그리드는 픽셀(pixel) 또는 셀(cell)이라고 불리는 작은 단위로 나눠져 있으며, 각 픽셀은 해당 지점의 값을 나타냅니다.

- 픽셀 단위의 값: 각 픽셀은 해당 지점의 속성, 값, 색상 등을 나타냅니다.

예를 들어, 흑백 이미지의 경우 각 픽셀은 밝기 값을 가지고 있고, 컬러 이미지의 경우 각 픽셀은 RGB(빨강, 녹색, 파랑) 색상 값을 가지고 있습니다.


-  공간 해상도: 그리드의 크기에 따라 래스터 데이터의 공간 해상도가 결정됩니다. 픽셀 크기가 작으면 공간적인 세부 정보를 높은 해상도로 표현할 수 있지만, 대신 그만큼 용량이 커집니다.


-  연속적인 데이터 표현: 벡터 데이터가 분리된 정보를 표현하는 데 유리한 것과 달리, 래스터 데이터는 연속적인 정보를 표현하기에 적합합니다.


-  저장 공간: 래스터 데이터는 픽셀 단위로 값을 저장하기 때문에 공간 효율성이 비교적 낮습니다. 특히 고해상도 데이터의 경우 용량이 매우 큽니다.



3) 벡터 데이터와 래스터 데이터


하나의 지도 안에서 두 유형의 데이터가 공존할 수 있으며, 도구를 사용하여 벡터 -> 래스터, 래스터 -> 벡터 변환 가능합니다.

변환방식은 아래와 같습니다.




6. 공간데이터 파일 유형

1) Shapefile

ESRI에서 개발된 가장 널리 사용되는 공간 데이터 파일 형식 중 하나입니다. Shapefile은 점, 선, 면 등의 지오메트리 데이터와 속성 데이터를 저장합니다. .shp, .shx, .dbf 등의 확장자를 가지며, 벡터 데이터를 저장하는 데에 사용됩니다.

가장 중요한 확장자는 shp이지만, 아래와 같이 하나의 데이터를 사용하기 위해서는 shp 이외에 다양한 확장자 파일이 필요합니다. shp만 있으면 활용할 수 없습니다.


2) GeoJSON

GeoJSON은 지리적인 데이터를 표현하기 위한 JSON 기반 형식입니다. GeoJSON 파일은 지오메트리 유형과 해당 속성 데이터를 포함하며, 지점, 선, 폴리곤 등을 표현할 수 있습니다. .json 확장자를 가지며, 벡터 데이터를 저장하는 데에 사용됩니다.

https://ko.wikipedia.org/wiki/GeoJSON

3) GeoTIFF

GeoTIFF는 지리정보를 포함하는 TIFF 이미지 파일 형식입니다. 픽셀 기반의 래스터 데이터를 저장하며, 지리적인 위치와 추가 정보를 포함할 수 있습니다. .tif 또는 .tiff 확장자를 가지며, 고해상도 영상이나 지형 데이터와 같은 래스터 데이터를 저장하는 데에 사용됩니다.


원격탐사에 사용되는 위성영상 데이터 (tif 확장자)


4) KML/KMZ

KML(KMZ)은 Google Earth와 같은 가상 지구 소프트웨어와 호환되는 공간 데이터 파일 형식입니다. KML은 지오메트리, 스타일, 속성 데이터 등을 포함하여 지리 정보를 기술하는 XML 기반 형식입니다. .kml 또는 .kmz(KML 압축 파일) 확장자를 가지며, 점, 선, 폴리곤 등을 포함한 벡터 데이터를 저장하는 데에 사용됩니다.

kml 확장자를 이용하여 구글어스 위에 나타낸 결과


5) PostgreSQL/PostGIS

PostgreSQL 데이터베이스와 PostGIS 공간 데이터 확장을 사용하여 공간 데이터를 저장할 수 있습니다. PostgreSQL은 관계형 데이터베이스이며, PostGIS는 공간 데이터를 저장하고 공간 쿼리를 수행하는 데에 사용되는 확장 기능입니다. 벡터 및 래스터 데이터를 저장할 수 있습니다.






그럼 다음 편에서 만나요!



                    

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari