brunch

You can make anything
by writing

C.S.Lewis

by 더굿북 Feb 03. 2017

02. 기업들은 왜 빅데이터를 원하는가?

<IT 트렌드를 읽다>

사람들의 마음을 읽을 수 있다.

왜 기업들은 ‘빅데이터’에 관심을 가지게 되었을까?

가장 큰 이유는 역시 ‘기술 발전’ 때문이다. 스마트폰이 대중화되면서 우리는 언제 어디서나 인터넷에 접속된 상태가 되었다. 그러다 보니 걷잡을 수 없을 만큼 많은 데이터를 생산하고 있다. 중국기업 ‘텐센트’가 18년 동안 축적해온 빅데이터의 규모는 세계 최대 도서관인 미국의회도서관 장서량의 1만 5천 배에 달한다고 한다. 이 정도의 양이면 데이터를 분석하는 것도 쉬운 일이 아닐 듯싶다.

사람들이 생산해 내는 데이터는 호불호를 명확히 알 수 있는, 즉 YES와 NO로 구분할 수 있는 정형화된 데이터만이 아니다. 페이스북에서 ‘좋아요’를 누르는 일, 어떤 제품에 대한 기호, 친구들과의 잡담에 이르기까지… 이런 데이터들을 ‘비정형 데이터’라고 하는데, 얼핏 보면 쓸모없어 보이지만 막대한 데이터가 쌓이게 되면 분석을 통해 의미 있는 결과를 도출해낼 수 있다. 그런 믿음 하에 기업들은 빅데이터 분석을 통해 ‘사람들의 마음까지 읽을 수 있다’고 한다.

가능한 일일까? 물론이다. 데이터를 제대로 분석해낸다면 충분히 가능하다. 누가 언제 어디서 무엇을 먹는지에 대해 집단화해서 데이터를 가질 수 있다면, 그동안 진행했던 ‘설문조사’들은 불필요한 일이 된다. 마치 영화 <마이너리티 리포트>의 세상처럼 물건을 파는 회사들은 우리가 관심을 가지기도 전에 이미 살 것을 알고 쿠폰을 보내게 된다. 엄청난 일이다.

관련 영화, <마이너리티 리포트>



어느 날 집에 임신과 관련된 각종 홍보물과 샘플들이 배송되기 시작했다. 수취인은 바로 ‘10대 딸’. 말도 안 되는 일이라고 생각한 아버지는 발송처에 항의를 했는데, 정작 문제는 임신이 사실이었다는 것이다. 아버지가 알기도 전에 관련 회사가 먼저 알게 된 이 농담 같은 일은 이미 2012년 미국에서 벌어진 실화로, 뉴욕타임스에 기사가 실리게 되면서 빅데이터의 위력을 실감한 사례가 되었다. 과연 ‘빅데이터’를 분석한 것에서 발생한 결과였는지에 대해서는 아직 논란의 여지가 있다. 다만 앞으로 이런 일이 발생할 수 있으리라는 건 쉽게 짐작해볼 수 있다.

빅데이터는 어디까지 개인정보를 허용하고 허용하지 않을 것인가? 이는 개인정보의 문제와 떨어져 생각할 수 없다.


가트너그룹의 3가지 정의 + 2

2001년 미국의 가트너그룹에서는 데이터가 늘어나는 현상을 3V(Volume, Variety, Velocity)로 정의했다. 그리고 2012년에 ‘빅데이터는 큰 용량, 빠른 속도, 높은 다양성을 갖는 정보자산으로서, 이를 통해 의사결정 및 통찰 발견, 프로세스 최적화를 향상시키기 위해서는 새로운 형태의 처리 방식이 필요하다’라고 재정의했다.

빅데이터의 실체는?


Volume는 ‘규모’를 말한다. 빅데이터라는 말은 엄청난 규모의 데이터를 의미한다. 페이스북에 저장되는 사진의 양은 하루 20억 장이다. 상상이 되는가? 이외에 가벼운 ‘대화’ ‘위치’ 등의 자료가 추가되면 그 양은 더 많아질 수밖에 없다.

Variety는 ‘다양성’이다. 보통 ‘데이터’라는 말을 들으면 컴퓨터 안의 ‘파일’을 생각하기 쉬운데, 이런 것들은 잘 짜여져 있고, 뭔가 정리된 것 같기에 ‘정형화’되어 있다고 말한다. 그런데 빅데이터에서 수집되는 내용들은 다양하다. 카드 사용내역뿐만 아니라, 페이스북에 사진을 올리는 일, 주고받은 대화, 자주 쓰는 표현 등 무수히 많은 데이터를 다루게 된다.

Velocity는 ‘속도’다. 많은 양의 데이터를 분석해 결과를 도출하기 위해서는 당연히 빠른 속도의 분석과 이를 해결해 주는 기술발전이 필요하다.

여기에 2가지 요소를 더할 수 있다. 바로 정확성(Veracity)과 가치(Value)다. 방대한 데이터를 기반으로 해야 하지만 이왕이면 양질의 데이터, 의미 있는 데이터를 분석해야 한다는 것이 정확성이고, 가치는 이런 빅데이터의 분석을 통해 도출된 결과는 의미가 있어야 한다는 걸 말해준다.

정리해 보면 사람들이 쏟아낸 ‘비정량적’ 자료들은 기술의 발전에 따라 사람들이 무엇을 좋아하는지 어디로 가는지 등에 대해 마케터들에게 딱 필요한 정보를 제공해줄 수 있다. 다만 그냥 쌓여져 있기만 해서는 의미가 없고, ‘정확성’과 ‘가치’가 있어야만 의미가 있는 것이다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari