brunch

You can make anything
by writing

C.S.Lewis

by 삼더하기일 Oct 08. 2022

쉽게 만나는 여러 가지 빅데이터 ① 통합 데이터지도

흩뿌려진 데이터 탐색

쉽게 만나는 여러 가지 빅데이터


빅데이터를 강조하는 것은 산학을 막론하고 일어나고 있는 최근의 보편적인 현상 중 하나입니다. 회사 내에서 업무를 진행할 때 데이터 기반의 의사결정이라는 단어는 너무도 널리 쓰이기 시작했으며, 빅데이터와 인공지능 분야를 포괄하는 데이터사이언스 분야는 이미 학계에서 가장 트렌디한 연구 주제 중 하나입니다. 그리고 데이터 기반의 의사결정, 인공지능, 딥러닝, 머신러닝, 데이터 분석, 데이터 과학 등 이 현상을 아우르는 모든 중심에는 빅데이터가 있습니다. 

 

이러한 현상에 따라 지금 사회에서는 수없이 많은 빅데이터가 생성되고 저장되고 있습니다. 하지만 평소에 빅데이터를 직접 접할 경험을 해본다는 것은 생각보다 어려운 일이 될 수 있습니다. 회사에서 빅데이터를 접하고자 한다면 기본적으로 직장인이어야 하며, 그중에서도 데이터 접근에 대한 권한을 획득하고 이를 실제로 업무에 활용할 상황이 주어져야 가능합니다. 회사 바깥으로 나가면 상황은 더욱 난처할 수 있습니다. 아무리 이 세상에 빅데이터가 많다 한들 우리의 PC 안에는 빅데이터가 저장되고 있을 리 만무하며 데이터가 곧 재산이자 정보인 세상에서 이에 접근할 일이라는 것이 쉽게 발생되지 않기 때문입니다.

 

통합 데이터지도란?


공공/민간의 데이터를 쉽게 찾고 활용할 수 있도록 검색 및 탐색 서비스를 제공

 

이러한 상황에서 우리나라 국민이라면 모두가 쉽게 빅데이터에 접근할 수 있도록 만든 플랫폼으로 통합 데이터지도가 있습니다. 우리가 관심을 가지지 않은 채 삶을 살다 보면 잘 모를 수 있지만, 생각보다 우리나라는 데이터 친화적인 정책을 많이 펼치고 있습니다. 공공과 민간을 막론하고 다양한 사람들이 데이터에 접근할 수 있도록 많은 데이터가 이미 개방되어 있습니다. 다만 이 데이터는 데이터를 배포한 플랫폼에 한정되어 확인을 할 수 있는 경우가 많습니다. 통합 데이터지도는 이러한 데이터 배포 현황에 대한 단점을 극복하고자, 공공/민간의 데이터를 쉽게 찾고 활용할 수 있도록 검색 및 탐색 서비스를 제공하고 있습니다.

 

실제 통합 데이터지도 홈페이지 (출처 : https://www.bigdata-map.kr/)


데이터 검색에 초점을 맞춘 서비스가 등장했다는 것은 생각보다 큰 의미를 지니고 있습니다. 공공데이터 포털과 같이 다양한 데이터를 무료로 활용할 수 있도록 배포하고 있는 플랫폼은 점차 늘어나고 있습니다. 실제로 데이터 분석 연습 혹은 데이터 탐색 목적으로 다양한 데이터를 만나보고자 한다면, 몇 가지 플랫폼만 확인하더라도 사용 가능한 데이터를 확보하는 것이 그리 어려운 일이 아닙니다. 하지만 데이터 친화적인 정책이 발전은 해가고 있지만, 그 내용을 살펴보면 데이터 개방 플랫폼만이 활성화를 띄고 있는 경향이 있다는 문제점이 있습니다. 분야를 막론하고 특정한 정보가 지나치게 쏟아질 경우 이를 체계적으로 정리하고 확인하는 것에는 많은 어려움이 따릅니다. 즉, 통합 데이터지도라는 서비스가 등장한 것은 이미 우리 주변에 활용 가능한 많은 데이터가 있다는 것을 의미하고, 데이터 활용성 측면에서 한걸음 더 앞서 발전할 준비를 우리 사회가 진행하고 있다는 것을 의미하게 됩니다.


관심 데이터에 대한 검색과 탐색

 

이러한 통합 데이터지도의 가장 기본적인 기능은 관심 데이터의 검색이라고 할 수 있습니다. 이 세상에는 셀 수 없을 만큼 무수히 많은 종류의 데이터가 있고, 보통의 사람이라면 이 모든 데이터에 흥미를 가지지는 않습니다. 결국 중요한 것은 본인의 관심사에 일치된 데이터를 탐색하고 확보하는 것입니다. 이 차원에서 통합 데이터지도는 가장 중요한 기능을 제공해주고 있습니다. 실제로 통합 데이터지도 홈페이지를 접속해보면 데이터 분류, 지역, 키워드, 플랫폼 분야 별 데이터가 체계적으로 정리되어 있는 모습을 확인할 수 있습니다. https://www.bigdata-map.kr/

 

통합 데이터지도의 데이터 현황 (출처 : https://www.bigdata-map.kr/dashboard)


일반적인 사람들의 관심 데이터는 어떤 기준에 의해 분류가 될 수 있을지 모릅니다. 그런 의미에서 통합 데이터지도에서 제공해주고 있는 다양한 데이터 분류는 데이터를 분류하기 위한 하나의 기준으로 적절하게 활용할 수도 있으며, 다양한 사람들의 관심사를 적당히 그룹으로 나누어 이를 탐색하는 것에도 용이성을 더해주었습니다. 행정, 의료, 환경 등 데이터의 주제에 따라 데이터를 탐색할 수도 있으며, 각 지역에 분포되어 있는 특화 데이터를 기준으로 데이터를 보거나, 플랫폼에 따라 데이터를 구분하여 탐색하는 것 역시 가능합니다. 저는 각자의 관심 데이터가 무엇이든 이 분류 체계에서 반드시 확인이 가능할 것이라는 개인적인 생각을 가지고 있습니다.


데이터 속에 숨어있는 이야기

 

통합 데이터지도가 가지고 있는 또 하나의 장점은 단순히 데이터를 검색하고 탐색하기 위한 기능만을 제공하지 않는다는 점입니다. 다양한 공공데이터를 민간에 제공하는 것을 시작으로 우리나라는 다양한 데이터 셋이 일반인들에게 개방되어 있습니다. 하지만 단순 데이터 개방을 넘어 이 데이터들이 실제 활용이 되어야 의미가 있음을 감안할 때, 개방된 데이터들이 활용성이 높은가에 대해서는 언제나 많은 의문부호가 달려왔습니다. 이때, 통합 데이터지도에서는 데이터 분석 결과나 데이터 주제와 연관되는 다양한 사회 이슈들을 함께 소개하고 있습니다. 즉, 데이터 속에 숨어있는 이야기를 함께 제공해주고 있다고 할 수 있습니다.


통합 데이터지도의 데이터 스토리 (출처 : https://www.bigdata-map.kr/datastory)


먼저, 통합 데이터지도에서는 데이터 스토리라는 이름으로 특정 데이터 분석 결과를 제공해주고 있습니다. 통합 데이터지도에서 확인 가능한 여러 데이터 셋들에 대한 분석 결과 보고서의 개념이라고 이해를 할 수 있습니다. 이를 자세히 살펴보면 사용자의 상황에 따라 여러 활용성을 지닐 수 있습니다. 만약 데이터 분야를 공부하는 학생이 이 결과 보고서를 본다면, 전반적인 분석 프로세스와 분석 결과 보고서의 틀을 이해할 수 있으며, 특정 분야의 전문가가 이 보고서를 본다면 해당 분야에서 데이터 차원에서 발생되는 이슈가 무엇이 있는지를 파악할 수 있습니다.

 

다음으로 이슈 데이터 탭에서는 현재 사회에 다양한 이슈 현황들을 소개하고 있습니다. 이 부분에서는 통합 데이터지도와 직접적으로 연관이 있지 않는 내용이라 할지라도 사회 전반에 대한 이슈가 되는 내용을 다양하게 소개해주고 있습니다. 현재는 코로나, ESG, 부동산에 대한 내용이 사회에 미치는 영향들을 소개해주고 있는데, 이 이슈들과 함께 해당 주제에 대한 정보가 담긴 데이터셋을 함께 소개해주고 있습니다. 문제 인식을 거쳐 데이터를 통해 정보를 확인하고 데이터 분석을 기반으로 문제를 해결해 나가는 것이 데이터 분석의 기본 프로세스임을 감안한다면, 올바른 데이터 분석 절차를 위한 중요한 도우미 역할을 통합 데이터지도가 해주고 있음을 파악할 수 있습니다.

 

통합 데이터지도에 아쉬운 점


물론 통합 데이터지도에는 마냥 장점만 존재하는 것은 아닙니다. 실제로 통합 데이터지도를 사용해보면 의외로 불편한 점이 생길 수 있습니다. 개인적인 의견으로 통합 데이터지도를 이용했을 때 가장 단점이라고 생각되는 점은 바로 목적 없는 데이터 탐색이 불편하다는 점이었습니다. 데이터 과학자, 데이터 분석가의 입장에서 이 세상에 어떤 데이터가 존재하고 이를 실제로 살펴보는 것은 꽤나 중요한 일이 될 수 있습니다. 이 과정에는 특정한 목표 없이 어떤 데이터가 존재하는지 무작정 탐색하는 일이 수반되게 됩니다. 하지만 아쉽게도 각종 데이터에 대한 탐색을 주요 목적으로 하는 통합 데이터지도에서 이 부분만큼은 불편함이 존재합니다.

 

실제로 통합 데이터지도에서 데이터 탐색과 연관된 탭은 전체 7개의 탭 중 단 ‘데이터 현황’ 단 한 가지뿐입니다. 그리고 그 안에 앞서 설명한 데이터 분류, 지역, 키워드 등에 따라 데이터를 소개해주고 있는데, 이 탭에서 확인 가능한 것은 인기 데이터셋뿐입니다. 길게 늘어진 전체 데이터 셋을 살펴보며 어떤 데이터를 활용해볼까 고민하는 데이터 분석가 입장에서는 불편함을 느낄 수밖에 없습니다. 물론 직접 검색 기능을 통해 원하는 데이터를 검색할 수도 있지만, 목적 없는 데이터 탐색을 진행하다 보면 적절한 검색어가 없는 경우가 허다하기 때문에 이 부분은 향후 보완이 된다면 좋을 듯합니다.

 

빅데이터 활용성을 높이는 데 중요한 장치인 통합 데이터지도


결국 목적 없는 데이터 탐색을 고려한다면 불편한 점이 있을 수 있습니다. 다만 목적 없는 데이터 탐색에 니즈가 있는 사람은 생각보다 이 세상에 많지 않을 수 있습니다. 또한 그 서비스의 목적이나 기능을 생각한다면 우리 사회에 매우 필요하며 또 활용도가 높아질 수 있는 서비스라고 평가할 수 있습니다. 분명히 말하지만 빅데이터의 중요성은 날이 갈수록 더 강해지고 있으며, 이를 위한 정부와 민간 차원의 노력은 지속되어야 합니다. 하지만 그 노력이 데이터 개방이라는 단순화된 차원에 그치고 있으며, 통합 데이터지도는 데이터에 대한 검색 및 체계적 관리라는 측면에서 우리 사회의 데이터 친밀도를 한 단계 높일 수 있는 중요한 역할을 하게 될 확률이 높습니다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari