쓰레기를 정보로
"데이터는 쓰레기다" 조금은 자극적이면서 통 이해할 수 없는 문장입니다. 이러한 독특한 발언은 누가 했을까요? 네 바로 접니다. 저는 데이터를 '쓰레기'라고 표현합니다. 이미 제 저서에서도 몇 번 사용한 비유입니다. 그렇다면 정말 데이터는 쓰레기일까요? 표준국어대사전에서 쓰레기의 의미를 찾아보았습니다. "비로 쓸어 낸 먼지나 티끌, 또는 못 쓰게 되어 내다 버릴 물건이나 내다 버린 물건을 통틀어 이르는 말."이라고 합니다. 쓰레기가 가장 많은 곳으로 가보겠습니다. 쓰레기 매립지입니다. 이곳은 항상 악취가 가득합니다. 그리고 넓은 평지에 제각각 모양도 재질도 다른 쓰레기가 아무렇게나 높이 쌓여있습니다.
그런데 쓰레기 더미를 자세히 관찰해 보겠습니다. 우선 플라스틱 쓰레기가 많이 보입니다. 그리고 고철도 보이네요. 또 누군가 읽다만 책 한 묶음도 보입니다. 멀리서 봤을 때 쓰레기는 냄새나는 더미에 불과했지만 가까이서 본 이것은 제법 쓸만한 것들이 많이 보입니다. 이런 걸 쓰레기 반전이라고 해야 할까요? 그래서 일부 가난한 국가에서는 아이들이 냄새나는 쓰레기 속을 뛰어듭니다. 바로 돈을 벌기 위해서입니다. 쓰레기 안에는 아직 사용이 가능한 물건들이 많습니다. 재활용 가능한 물건을 주워 되팔기 위해서죠. 안타까운 현실입니다. 고통받는 아이들이 없기를 간절히 기도합니다.
한국에서는 쓰레기를 어떻게 재활용할까요? 가장 멋지게 쓰레기를 활용한 사례를 뽑자면 바로 상암동 '하늘공원'입니다. 1978년 3월부터 쓰레기 매립이 시작된 이곳은 1993년 3월까지 많은 쓰레기가 모여들었습니다. 여의도의 3분의 2에 가까운 19만 7천㎡ 터에 15년간 8.5톤 트럭 1300만 대 분량인 9197만 2천 톤의 쓰레기가 모여 해발 98m짜리 높은 산을 두 개 만들어 놓았습니다. 이 쓰레기는 치우지 않고 그대로 산으로 만들었습니다. 쓰레기 산을 흙으로 덮은 뒤 상부에 공원을 조성하여 지금의 노을공원과 하늘공원이 되었습니다. 쓰레기에서 발생하는 메탄가스 및 다른 혼합물로부터 나오는 에너지는 인근의 월드컵 공원과 서울월드컵경기장 시설의 열에너지원으로 활용되고 있습니다. 매년 10월에 개최되는 하늘공원 서울억새축제를 꼭 가보시기 바랍니다. 6만 평 억새밭 사이로 23개의 길을 정처 없이 걷다 보면 가을의 향기를 물씬 느낄 수 있습니다. 이처럼 그 더러운 쓰레기가 훌륭한 시민들의 휴식처가 되었습니다.
이제 데이터 이야기로 넘어가 보겠습니다. 우리가 사는 지구는 하루에 얼마나 많은 디지털 데이터가 쏟아질까요? IBM 통계에 따르면, 약 25억 GB(기가바이트), 20조 비트라는 어마어마한 양이 생성된다고 합니다. 이 모든 데이터를 하드디스크에 담고 싶다면 100GB(기가바이트) 하드디스크가 25,000,000개 필요로 합니다. 우리나라 전체 인구에 절반에게 나눠줄 수 있는 개수입니다. 하지만 그 많은 데이터들은 쓰레기처럼 인터넷에 여기저기 아무렇게나 널브러져 있습니다. 만약 누군가 활용하지 않는다면 그저 버려지는 휴지조각에 불과합니다. 하지만 쓰레기를 잘 정리하여 누군가에게 제공할 수 있다면 그것은 바로 '정보'가 됩니다.
쓰레기 더미 속에서 필요한 정보를 가장 잘 찾는 일꾼이 있습니다. 바로 '구글'입니다. 구글은 이 어머어마하게 쏟아지는 데이터들 중에 유용한 것들을 건져 자사의 데이터베이스의 차곡차곡 정리 정돈하여 쌓아 놓습니다. 그 양이 무려 10억 7000GB(기가바이트)입니다. 그렇게 정리정돈을 한 데이터는 구글 검색 클릭 한 번으로 엄청난 양의 데이터 홍수 속에 필요한 정보를 0.1초 만에 찾아줍니다. 구글은 데이터를 정보로 만들어 이윤을 창출합니다. 마치 쓰레기를 재활용해 하늘공원을 만든 사업처럼 말이죠. 이러한 기업이 있기에 우리는 데이터 홍수 속에서 원하는 정보를 찾을 수 있게 된 것입니다. 우리가 매일 클릭했던 '찾기' 버튼이 얼마나 위대한지 다시 한번 느껴집니다.
좀 더 나아가 우리 생활 속에 데이터들을 어떻게 활용해야 할까요? 우리의 삶 속에서도 엄청난 양의 데이터들이 쏟아집니다. 어제 들었던 교수님 강의도 데이터, 아침에 잠깐 읽었던 뉴스도 데이터입니다. 그리고 오늘 친구와 나눌 대화도 데이터, 각자의 일터에서 열심히 일했던 순간들도 모두 데이터입니다. 하지만 이렇게 쏟아지는 데이터들을 정보로 만들어 이윤을 창출할 수 있다면 우리의 시간은 좀 더 알차게 채워질 것입니다.
위 화면은 제 에버노트입니다. 모든 기록을 이 온라인 메모 프로그램입니다. 약 8년 정도 사용한 거 같습니다. 세월만큼 엄청난 양의 데이터들이 쌓여있습니다. 하지만 여기서 데이터만 모아두는데 급급하지 않고 저는 이 데이터들을 활용하였습니다.
첫 번째로는 '블로그'입니다. 코딩과 IT에 관련한 데이터들을 정리하여 정보로 만들어 블로그에 업로드하였습니다. 덕분에 애드센스로 광고수익을 얻었고, 기술서를 출간하였습니다.
두 번째는 '브런치'입니다. 에버노트에 적어둔 평소에 인사이트들을 정리하여 역시 정보로 만들어 브런치에 업르도 하였습니다. 역시 이 덕분에 저는 4권의 종이책을 출간하였습니다.
그렇게 저는 이름 없는 개발자에서 작가가 되었고 강연자가 되었습니다. 만약 에버노트에 있는 나만의 데이터들을 그대로 둔다면 아마도 아무런 쓸모가 없었을 것입니다. 쓰레기의 국어사전 의미처럼 말이죠.
여러분의 데이터도 오늘부터 한번 정보로 만들어 보는건 어떨까요?
* 출처
- https://www.joongang.co.kr/article/3168129
- https://www.ytn.co.kr/_ln/0104_201904220339446986
- https://www.chosun.com/site/data/html_dir/2017/06/05/2017060502138.html-