에레즈 에이든
<빅데이터 인문학>, 에레즈 에이든, 장바티스트 미셸
강 일 송
오늘은 빅데이터(Big Data) 이야기를 한번 해보겠습니다.
앞으로의 미래의 삶을 바꿀 획기적인 아이템의 그 중심에 빅데이터가
자리잡고 있다고 보여집니다.
이전에는 빅데이터를 모으기도, 분석할 도구도 마땅치 않았지만 사회가
모두 디지털화 되는 현대에는 다양한 분야의 빅데이터가 존재를 하고
분석할 수 있는 기술이 잘 준비되어 있습니다.
저자의 말을 들어 보겠습니다.
“빅데이터는 인문학을 바꾸고, 사회과학을 변형시키고
상업세계와 상아탑 사이의 관계를 재조정할 것이다.“
------------------------------------------------
. 전 세계적으로 한 사람이 연간 만들어 내는 데이터의 양은 거의
1 테라바이트(terabyte)에 가깝다. 이것은 약 8조개의 예-아니오 질문
과 맞먹는 양이다. 집단적으로 인류는 매년 5 제타바이트(zetabyte)의
빅데이터를 만들어낸다. 이것은 40,000,000,000,000,000,000,000(400垓)
바이트다.
. 1 테라바이트의 정보를 손으로 직접 쓴다면 토성을 스물다섯 번 왕복할
것이다. 5제타바이트를 손으로 쓴다면 은하수에 있는 은하계의 중심에
도달할 것이다. 이런 종류의 어마어마한 기록을 빅데이터(Big data)라
부른다. 우리의 삶이 인터넷으로 옮겨가면서 인간이 만들어내는 데이터의
양은 2년마다 두 배씩 늘고 있다.
빅데이터는 더 커지고, 더 커지고, 더 커지는 중이다.
. 인플루엔자가 유행할 때, 구글에서 사람들이 인플루엔자의 증상, 합병증,
치료약에 대해서 더 많이 검색을 하는데, 이것을 통해서 독감유행을 예측
하는 시스템을 개발하자, 질병의 조기경보를 위해 고비용의 막대한 인프라
를 유지하는 미국 질병통제예방센터보다 훨씬 더 빨리 새로운 독감 유행을
식별해 낼 수 있었다.
◉ 구글의 야심, 단 하나의 도서관
- 구글은 세상에서 만들어진 모든 책을 망라한 디지털 도서관을 지향했다.
- 이 프로젝트를 선언하고 9년이 흐른 뒤, 구글은 3000만권의 책을 디지털
화했다. 이는 현재까지 출간된 책의 네 권 중 한권이다.
- 하버드도서관 (1700만권), 스탠퍼드도서관(900만권), 한국국립중앙도서관
(730만권), 러시아국립도서관(1500만권), 중국 국립도서관(2600만권),
독일국립도서관(2500만권) 보다 훨씬 많다.
유일하게 미의회도서관(3300만권)이 더 많지만 곧 추월할 것이다.
- 이 방대한 텍스트를 읽으려고 한다면 분당 200단어씩 읽는다고 해도
총 1만 2000년이 걸릴 것이다.
. 2007년 이 책의 저자인 하버드의 두 젊은 과학자가 구글이 구축한 디지털
도서관으로 들어가, 클릭 한번으로 800만권의 책을 검색하는 “구글 엔그램
뷰어“를 개발했다. 데이터가 그리는 아름다운 곡선이 전 세계 인문학계를
발칵 뒤집어 놓았다.
. 이 프로그램은 단어 하나를 입력하고 엔터를 누르면, 순식간에 800만권을
검색해 지난 500년간 사용된 빈도의 추이를 그래프로 보여준다.
이렇게 방대한 양의 데이터를 이용해 인간의 역사와 문화를 분석하는 새로
운 분야에 저자들은 “컬쳐로믹스(Culturomix)"라는 이름을 붙였다.
. 아래 사진으로 몇 개의 엔그램 뷰어에 의한 그래프를 보겠습니다.
한번 의미를 생각해 보시길 바랍니다.^~
------------------------------------------------------
미래학자가 아니더라도 요즘은 빅데이터에 대한 이야기를 하는 사람들이
참 많습니다. 모수가 무한대로 접근할수록 대체로 진실에 가까워지는
것으로 보입니다.
빅데이터로 이미 많은 응용산업이 일어나고 있고, 우리가 예측하지 못했던
미래가 펼쳐질 것으로 예상이 됩니다.
의료분야에서도 우리나라는 전 세계에서 유래가 잘 없는 엄청난 의료 데이터를
확보하고 있습니다. 공적 보험으로 전 국민 의료보험을 하는 나라도 드물고
그 중에서도 우린 뛰어난 IT기술과 융합하여 많은 데이터를 가지고 있지요.
한편으로는 우리나라가 의료시장의 미래에 교두보를 선점하고 있다고
생각이 듭니다.
미래에는 데이터를 가진 곳이 권력을 가질 것이라 하고, 연관이 적어 보이는
인문학, 사회학도 엄청난 변화를 같이할 것이라 합니다.
세상을 지배할 듯이 데이터를 지배하는 구글의 무서움도 새삼스럽고
거부할 수 없는 현실로 다가오는 빅데이터 시대에 자기를 돌아보고 자신의
분야에서의 변화의 물결을 잘 파악하는 것이 선택이 아닌 필수가 되고
있다는 생각이 듭니다.
감사합니다.~