미래세상 읽기 : 1부 4차 산업혁명과 국가(13)

미래의 원자재는 ‘빅데이터’이다

by 조작가Join


임박한, 제4차 산업혁명 시대


4차 산업혁명 시대를 별도로 구성한 이유는 앞에서도 말했듯이 4차 산업혁명은 이전의 산업혁명과 그 성격이 다르기 때문이다. 최초로 예측되는 혁명으로 역사(과거)가 아닌 미래이다.


4차 산업혁명은 독일의 인더스트리 4.0(Industrie4.0)에서 시작됐다. 그 정의(定義)도 다양한데, 간략하게 살펴보면,


“인더스트리 4.0은 스마트 공장의 도입을 통해 전 세계적으로 제조업의 가상 시스템과 물리적 시스템이 유연하게 협력할 수 있는 세상을 만드는 개념” 『2011년 하노버박람회』


“디지털 혁명을 기반으로 한 제4차 산업혁명은 21세기의 시작과 동시에 출현했는데 유비쿼터스 모바일 인터넷, 더 저렴하면서 강력해진 센서, 인공지능과 기계학습이 제4차 산업혁명의 특징이다.” 클라우스 슈밥(WEF 회장)


“제4차 산업혁명은 실제 세계와 기술 세계의 구분을 모호하게 만드는 개념이다.” 제이콥 모건(미래학자)

위의 정의를 살펴보면, 융합, 유연한 협력, 디지털 혁명, 구분의 모호함 등을 말하는데 디지털 혁명을 바탕으로 한 ‘연결성’을 강조하고 있다.

따라서 이번 장에서는 인공지능, 자율자동차, 사물인터넷 등 다뤄야 할 것들이 많지만, 연결성과 관련된 5G와 4차 산업혁명 시대의 원료라고 할 수 있는 빅데이터(big data)를 중심으로 살펴보고자 한다.


빅데이터 - 빅데이터는 21세기의 원자재이다

말 그대로 ‘빅(Big)’ 큰 것인데, 엄청난 것으로 이해하면 된다. 그 속도가 엄청 크고(빠르고), 그 다루는 범위도 엄청 크다(다양하다). 영어로는 주로 3V(Volume, Velocity, Variety) 했다가 이후에는 한 가지 V(Veracity(진실성)를 추가해서 4V라고 표시했다. 그러다가 또 다른 V가 추가됐는 데 Value로 가치를 의미한다.

엄청나게 다양한 종류의 데이터, 엄청난 양의 데이터가 엄청난 속도로 늘어나는 가운데, 그중에서 가치 있는 정보를 찾아서 정리와 활용해야 한다는 의미다. 독일의 미래학자 군둘라 엥리슈의 이미 고전이 된 『잡 노마드 사회』에서는 정보만 있다고 해서 바로 지식이 되는 것이 아니라, 정보를 제대로 잘 구별하고 분류해야 사용할 수 있다고 설명한다.


인간이 통제하고 평가하고, 처리할 수 있는 수준의 정보가 아니라 성능 좋은 컴퓨터만이 빅데이터를 처리할 수 있다. 엑셀과 같은 프로그램으로 사람이 일일이 정리한다는 게 불가능해졌다는 말이다. 그래서 인공지능과 슈퍼컴퓨터의 역할이 중요해진다.


빅데이터는 선진국과 국내에서도 활용도가 높다. 아래는 빅데이터와 관련한 사례를 몇 가지 소개한 것이다.


사례 1 : 비가 오면 가장 많이 팔리는 물품이 당연히 우산이라고 생각하겠지만, 이유는 정확히 알 수는 없으나 초콜릿이라고 한다. 그래서 우산을 파는 상점이라면 초콜릿을 우산 옆에 진열하면 매출 효과를 볼 수 있다.


사례 2 : 아이 기저귀를 사러 가는 아빠들은 맥주를 많이 구매한다. 그래서 마트에서는 아이 기저귀 옆에 맥주를 잔뜩 진열해 놓는다. 정확한 이유는 모르지만, 기저귀 판매와 맥주 판매는 관련이 있다.


사례 3 : 구글은 독감과 관련하여 빅데이터를 분석해서 독감 유행의 가능성을 거의 완벽하게 예측한 적이 있다. 물론, 이후에 다시 시도해서 실패해서 빅데이터를 반대하는 사람들한테 호되게 당한 적이 있다. 그럼에도 불구하고 빅데이터를 활용한 질병 예측 능력은 계속 발전하는 추세이다.


사례 4 : 2014년 브라질 월드컵 당시 빅데이터 분석과 관련한 뉴스 2가지가 화제가 됐다. 첫 번째는 마이크로소프트가 빙(Bing)과 음성인식 솔루션 콘타나(Contana)가 16강전부터 결승까지 총 16경기를 예측한 결과 15경기의 승패를 맞췄다는 내용이고, 두 번째는 독일의 소프트웨어 업체 SAP의 빅데이터 프로그램이 독일의 우승을 도왔다는 것이다.


사례 5 : 2016년 미국 대선에서 트럼프와 힐러리의 대결 중 설문에 응한 대다수 유권자는 힐러리의 압승을 예상했고 많은 여론 기관들도 힐러리가 승리하지 못할 이유가 없다고 하면서 힐러리의 승리를 예측했다. 그러나 구글의 빅데이터만 홀로 트럼프의 승리를 예측했고, 결과는 도널드 트럼프 대통령이 탄생했다. 그러나 구글의 뛰어난 빅데이터라고 하더라도 한국 정치지형의 예측은 힘들다고 한다.


이 이외에도 사례들이 참 많다. 우리가 편의점, 백화점, 마트 등을 지날 때 날아오는 메시지들, 온라인 서점에서 책을 구매할 때 함께 권해주는 책들, 온라인 쇼핑몰에서 무엇인가를 보고 있으면, 추천을 빙자해서 등장하는 것들, 그리고 내 소비 패턴을 분석해서 매달 지급되는 쿠폰과 광고들.

소비자의 연령대와 성향을 분석하고 파악해서 여행 상품을 제시하기도 하고, 숙박업소를 추천하기도 한다. 에어비앤비 같은 경우도 시스템은 간결하지만, 예약자의 성향을 분석해서 적합한 상품을 제안한다. 국내도 T – Map 등이 빅데이터를 활용하고 있으며, 교보문고를 비롯한 온라인 서점들도 빅데이터를 활용해서 책을 권해주고 있다.

SK텔레콤은 엄청난 가입자 수를 바탕으로 2011년부터 상권을 분석해주는 ‘지오비전(GeoVision)’을 운영하고 있다. 이 프로그램은 부동산 시세, 위치, 간단한 주변 정보에 국한된 서비스뿐만 아니라 다 각도로 정밀하게 상권을 분석해준다.

문서와 관련해서 구글은 특정한 단어를 검색창에 치면, 그 단어가 역사적으로 얼마나 많이 어떻게 사용되었는지를 보여주는 ‘구글엔그램뷰어(books.google.com/ngrams)’를 운영한다. 검색창에 단어를 입력하고 한 번 클릭하면, 지난 500년간 단어가 사용된 빈도 추이를 그래프로 볼 수 있다. 이를 위해서 참고하는 책이 무려 800만 권이라고 한다. 이 역시 빅데이터를 활용한 것이다.

빅데이터는 현재 마케팅 분야에서 많이 사용하고 있으며, 정치, 교육, 경제할 것 없이 다양한 분야에서 활용도를 높이고 있다. 그러나 빅데이터와 관련한 분야에서도 국가 간 차이는 무시할 수 없다. 고한석 작가의 『빅데이터 승리의 과학』은 전 미국 버락 오바마 대통령의 당선을 빅데이터와 연관 지은 책이다. 책 내용만 보면, 빅데이터의 놀라운 효과에 감탄할 수밖에 없다. 그 시점이 2010년대 초반이었다고 생각하면 더 놀랍다. 참고로 비슷한 시기에(2012년 초) 국내에서는 빅데이터를 능숙하게 관리할 수 있는 인력이 100명 안팎이었다고 한다. 당연한 일이겠지만, 정보 불평등에서 빅데이터 불평등으로 자연스럽게 넘어가는 듯하다.


빅데이터는 아직 완벽하지 않다. 그리고 모든 사람에게 만족을 주는 수준으로 발전하지 않을 수도 있다. 하지만, 단언컨대 빅데이터는 현재 공기만큼이나 인간의 삶에 빠져서는 안 되는 중요하고 편리한 원료가 될 것이다. 동시에 조지 오웰(George Orwell)의 『1984』에 등장하는 ‘빅 브라더(Big Brother)가 현실에 등장하는 것 아니냐?’는 우려도 만만치 않으리라 생각한다.

keyword
작가의 이전글미래세상 읽기 : 1부 4차 산업혁명과 국가(12)