우리가 만드는 데이터들, 얼마나 어디에 저장할까
우리 하루의 일상 속에서 의식적 내가 만들고, 무의식적으로 만들어지는 데이터는 얼마나 될까?
아침에 일어나 스마트폰을 켜면서부터 아니 잠들어 있는 와중에도 스마트폰은 늘 LTE, 5G로 기지국에 연결되어 스마트폰의 위치 정보와 내게 도착한 페이스북, 카카오톡 알람, 이메일 등의 메시지들이 클라우드 저 넘어 기록된다. 스마트폰에 잠금해제를 할 때부터 네이버 앱을 실행해 날씨 정보를 확인하고 검색하고, 쿠팡에 들어가 배송 정보를 체크하고, 인스타그램에서 좋아요를 누르고, 이메일을 확인하는 과정에서 데이터가 기록된다. 하루에도 스마트폰을 수십번 보기 때문에 그때마다 쌓이는 정보의 양은 누적되기 시작하면 어마어마할 것이다. 유투브, 넷플릭스, 멜론 등을 즐긴다면 컴퓨터와 스마트폰에 이들 서비스를 사용하면서 끊김없이 영상이나 음악을 재생해주기 위해 일부 데이터가 저장되어진다. 웹서핑을 하게 되면 웹브라우저에 우리가 방문한 사이트의 URL과 함께 제대로 보지도 않았던 이미지와 텍스트 등의 HTML 데이터가 저장된다. 심지어 배터리 최적화를 위해 배터리를 가장 많이 소모하는 앱이 무엇이고 언제, 얼만큼, 무슨 앱을 이용했고 그때 배터리는 얼마나 소모되었는지 등의 정보까지도 배터리 효율화라는 목적으로 기록된다. 그렇게 우리도 미쳐 인지하지 못하는 사이에 엄청난 데이터들일 수집되고 있다.
내가 인지하고 저장되는 데이터들도 있다. 카메라로 촬영한 음식사진과 아이들 영상, 멋진 경치와 여행사진, 세미나와 회의 관련해 촬영하는 화이트보드 사진과 각종 제품 사진 등등 이 모든 것이 우리 스마트폰에 저장된다. 클라우드와 연동을 해두면 폰에 저장된 데이터와 똑같은 데이터가 클라우드에 복제되어진다. 팟캐스트를 통해 구독 중인 라디오 방송도 저장되고, 카카오톡으로 주고 받은 사진과 영상 그리고 메시지를 통해서도 데이터가 저장된다. 구글포토, 아이클라우드, 아마존 클라우드, 드랍박스 여러 개의 클라우드 앱을 이용한다면 각각의 클라우드별로 그런 데이터가 똑같이 기록되어질 것이다. 회사 업무나 학교 보고서 작성을 위해 다운로드받은 PDF와 작성 중인 파워포인트, 한글 문서도 우리가 사용하는 노트북, 태블릿, 스마트폰에 저장되어진다.
우리 일상, 사회 속에서 저장되는 공용 데이터들도 있다. 길거리에 있는 CCTV와 회사 등에서 설치한 IP카메라는 클라우드에 연결되어 모든 장면을 영상으로 기록하고 있다. 공장에서 각 공정의 기계들이 만들어내는 데이터와 회사에서 경영활동을 하며 쌓이는 데이터들도 있다. 이렇게 우리는 디지털 세상 속에서 엄청난 양의 데이터들을 배출하고 있다. 그렇게 배출된 데이터들은 쓰레기처럼 분리 수거가 되지 않고 우리 로컬 기기와 클라우드에 우선 쌓여간다. 데이터가 미래의 원유이고 중요하다는 미명 아래 우선 모든 데이터는 가급적 삭제하지 않고 그렇게 저장한다. 사실 기계적으로 수집되어 축적되는 데이터 중 꺼내어 사용하지 않고 분석되지 않는 것은 아무짝에도 쓸모없는 디지털 쓰레기일 뿐이다. 데이터 정제가 중요한 것은 불필요한 데이터를 주기적으로 솎아내서 버림으로써 더 소중한 데이터를 더 오래도록 보관할 수 있기 때문이다.
우리 컴퓨터만 해도 얼마나 많은 데이터들이 저장되어 있는가. 그리고, 클라우드와 연결해 이 데이터는 고스란히 태블릿, 노트북, 스마트폰과 동기화되어 세벌, 네벌 같은 데이터가 저장되기도 한다. 우리가 사용하는 디지털 기기가 많아지면서 이들 기기간 데이터 동기화를 위해 각 기기에 중복해서 데이터가 저장되고 있다. 이렇게 쌓여가는 데이터들의 유통기한은 언제까지 일까? 사실 1년에 한 번도 다시 들여다보지 않을 데이터임에도 불구하고 언젠가 필요로 하지 않을까 하는 막연함 때문에 그렇게 메모리 한 귀퉁이를 계속 차지하고 있다. 그렇게 자원을 차지하는 데이터들을 유지하기 위해 얼마나 많은 비용이 들어갈까. 또, 그런 데이터를 계속 저장하기 위해 우리는 얼마나 많은 비용을 감수해야 할까.
2021년 6월부터 구글은 구글포토라는 사진 클라우드 서비스를 유료화했다. 2015년 5월부터 무료로 서비스하던 구글포토는 전 세계 10억명의 가입자들이 애용하는 사진 클라우드 서비스이다. 하지만, 넘쳐 나는 사진, 동영상 저장을 계속 지원할 수 없다보니 15GB까지는 무료지만 그 이상을 사용하려면 구글원에 가입해 월 2200원에 100GB까지 사용하는 유료화를 단행한 것이다. 구글포토 사용자의 80%는 15GB 이하를 사용하고 있어 당장 돈을 내야 하는 상황은 아니지만 수십 GB를 넘어가는 우리 스마트폰 속 사진과 영상 데이터를 앞으로 계속 클라우드에 자동으로 동기화를 하며 저장하다보면 1~2년내 유료로 사용하든 불필요한 데이터를 삭제해야 한다.
그렇게 데이터를 저장하고 유지하는데 비용이 들어가기 마련이다. 매일 쓰레기를 비우듯이 디지털 세상에서도 불필요해진 데이터는 수시로 비우는 습관이 필요하다. 빅데이터의 시대에 개인도 데이터를 효율적으로 관리하는 지혜가 요구된다. 너무 많아진 데이터는 불필요한 하드디스크와 클라우드의 자원을 사용함으로써 사회적 낭비이면서, 너무 많은 데이터로 인해 정작 필요로 하는 데이터를 찾는데 불편을 겪을 수도 있다. 사용하지 않는 클라우드는 과감하게 탈퇴하고, 내가 사용하는 컴퓨터, 노트북, 태블릿, 스마트폰에 저장된 데이터 중 1년간 한 번도 찾지 않은 데이터는 클라우드와 동기화되지 않는 컴퓨터 하드디스크에 저장해두었다가 앞으로 2년, 3년이 지나도 찾지 않은 경우 과감하게 삭제하자. 3년간 찾지 않았다면 앞으로 3년 후에도 찾지 않을 가능성이 크다. 그렇데 데이터 다이어트를 하면서 디지털로 기록된 데이터들을 살펴보며 각 데이터들의 중요도와 필요성에 대해 다시금 되돌아보는 기회와 여유를 갖게 될 것이다.
물론 개인을 넘어 기업, 사회적 차원에서도 '데이터 다이어트’를 돌아보고 효율적인 데이터 관리 방안을 진단해볼 때이다. 기술적 측면에서 볼 때 데이터 압축이나 여러 곳에 저장한 동일한 파일은 하나만 남기고 삭제하고, 로컬에 파일을 저장하지 않고 스트리밍으로 필요할 때에만 전송해서 사용하는 방안을 찾아볼 수 있다. 또, 기업에서 수집한 데이터들도 데이터 활용의 목적에 맞지 않은 파일은 즉시 삭제하고 원본 데이터보다 이를 가공해 용량을 최적화한 데이터만 저장하는 등의 방법을 찾아야 한다.
✍ 도서 추천 : IT사용설명서
http://www.yes24.com/Product/Goods/103335265