GIS 데이터를 가지고 다양한 지도를 만들고 분석을 하다보면, 다양한 데이터 형식을 보게 됩니다.
가끔 이상한 GIS 데이터를 받게 되면, 멘붕에 빠지게 됩니다.
"이 데이터를 가지고 어떻게 만들지;;;"
"이거 뭐 작업이 가능한건가;;;"
오히려, 좌표체계가 없거나, 다른 것은 쉽게 해결할 수 있습니다. 하지만 데이터 형식이 일반적이지 않을 때는 오히려 작업에 어려움을 느끼게 됩니다.
GIS는 본질적으로 크게 3가지 범주의 영역을 가지고 있습니다.
1. 지도 시각화
2. GIS 데이터 관리
3. 공간 분석
두번째 GIS 데이터 관리의 관점에 다양한 데이터를 기반으로 공간 정보를 만들고 편집하고 공유할 수 있습니다. 이러한 관점에서 여러 GIS 데이터의 유형을 아는 것은 필수적으로 요구되는 지식입니다. 대표적인 GIS 데이터 유형을 차례대로 알아보도록 하겠습니다.
먼저 이번에는 Vector GIS 데이터 형식을 알아보겠습니다. 벡터는 실세계의 다양한 객체(현상)들을 점, 선, 면과 같은 기본적인 심볼로 추상화하여 표현한 데이터 형식입니다.
1) SHP(Shapefile, 쉐이프파일)
GIS 데이터 중 전세계적으로 가장 범용적으로, 대중적으로 사용되는 데이터 형식입니다.
누군가 지정하진 않았지만 사실상 국제 표준 GIS 데이터 형식이라고 봐도 무방합니다.
그만큼 모든 GIS SW가 기본적으로 지원하는 형식입니다(쉽게 말해서 업.계. 표.준).
또한 다양한 공간정보들이 쉐이프파일을 형태로 만들어 저장, 관리되고 있습니다.
원래는 esri사의 Arcview 3.x 에서 사용하였던 기본 데이터 형식으로, 이 쉐이프파일은 그 구조가 인터넷에 공개되어 있어서 누구나 쉽게 가져다가 사용할 수 있습니다.
2) KML/KMZ(Keyhole Markup Language)
KML은 키홀 마크업 언어(Keyhole Markup Language)로 구글 어스, 구글 지도 및 기타 응용프로그램에 쓰이는 XML기반의 마크업 언어 스키마입니다.특별히 Keyhole사에 의해 개발되었고 2004년 키홀사는 구글에게 인수되었습니다. (이 키홀"keyhole"은 미국 최초의 광전자 공학 정찰 위성인 KH-11정찰위성을 기리기 위해 붙여진 이름이라고 합니다)
KMZ(KML-Zipped)는 쉽게 말하면 KML의 압축파일 버전이라고 생각하면 되겠습니다. KML/KMZ는 2008년 OGC(Open Geospatial Consortium)의 국제 표준으로 지정되었습니다.
WGS1984로 정의되어 있고 경, 위도(Decimal degrees)값으로 구성되어 있습니다.
3) GDB(Geodatabase)
esri는 다양한 GIS 형식의 정보를 저장할 수 있는 지오데이터베이스라는 컨테이너를 만들었습니다. 이 컨테이너에는 벡터, 래스터, 테이블 데이터셋 등을 저장할 수 있습니다. 이 지오데이터베이스에는 3가지 종류가 존재합니다.
-퍼스널 지오데이터베이스(Personal GDB) : MDB 형식으로 저장되며, 최대 2GB까지 지원
- 파일 지오데이터베이스(File GDB) : 현재 개인 사용자에 추천하는 형태, 파일 기반으로 최대 2TB까지 저장
- 엔터프라이즈 지오데이터베이스(Enterprise GDB) : RDBMS를 이용한 데이터 저장
파일 지오데이터베이스 내에서 쉐이프파일은 피처클래스로 언급됩니다(다시 말하면, 쉐이프파일을 지오데이터베이스에 넣으면 그 이름을 피처클래스로 부른다 입니다).이것은 네트워크, 래스터 모자이크, 피처데이터셋과 같은더 복잡한 데이터를 저장할 수 있게 됩니다. 다음 기회에 GDB에 대한 설명은 다시 한번 자세히 하도록 하겠습니다.
4) LYR(Layer)
레이어(Layer)파일은 맵의 심볼에 대한 구성을 시각화하는데 사용되는 파일입니다. 이것은 GIS데이터를 포함하고 있지 않고 단순히 어떻게 시각화할 것인가에 대한 정보만을 저장하고 있습니다.
일반적으로 벡터나 래스터 데이터를 공유해야할 때, 이 레이어파일은 공유하는 지도에서의 시각화의 일관성(같은 심볼화)을 보장해 줍니다. 즉, 내가 정의한 심볼을 공유하고 싶다면, 이 레이어파일을 저장해서 데이터와 함께 공유하면 다른 사람도 동일한 형태의 정의된 심볼을 사용할 수 있습니다.
5)OSM(Open Street Map)
OpenStreetMap은 전세계적으로 가장 큰 크라우드소싱 GIS 데이터 프로젝트입니다. OSM이라고 불리는 이 데이터 형식은 OpenStreetMap의 XML 기반 파일 형식으로 되어 있습니다. QGIS의 상호운용성(Data Interopability)에서 기본적으로 로딩을 지원합니다.
6)ArcInfo Coverage
ArcInfo Coverage는 꽤 오래된 GIS 데이터 유형입니다. 이 파일은 단순히 폴더의 집합으로 구성되어 있습니다. Coverage는 피처클래스를 Point, Arc, Polygon, annotation을 저장하는데 이용합니다. Tic은 Coverage의 공간적 범위를 정의하는 control Point입니다.
속성정보는 ADF또는 INFO 테이블에 저장되고, 각 피처는 고유한 숫자값(SHP파일의 FID와 같은)과 함께 정의되니다. 이러한 숫자값은 각 피처와 속성정보를 연결해 주는 역할을 담당합니다.
현재는 많이 사용하지 않는 데이터 형식이고, 이 데이터를 변환하거나 다루기 위해서는 상위 라이센스의 SW가 필요하기때문에 일반적으로 거의 안쓴다고 보시면 될 듯 합니다.
https://ko.wikipedia.org/wiki/%ED%82%A4%ED%99%80_%EB%A7%88%ED%81%AC%EC%97%85_%EC%96%B8%EC%96%B4