brunch

You can make anything
by writing

C.S.Lewis

by 범생 Jul 31. 2022

데이터 수집에 대한 오해 (9)

-  C 교수의  디지털 트랜스포메이션 시리즈 9번째 이야기


이하의 내용은 디지털 트랜스포메이션의 기업용 발표를 위한 장표에 대해 한 장 한 장의 설명에 해당하기에 장표의 구성에 따라 1페이지에서 3페이지를 설명하는 내용으로 주기적으로 배포, 연결되며 시리즈로 구성.



1.  데이터 수집의 오해

  나의 책상에는 10년이 넘은 자료들이 쌓여있다. 책상에서 제거되기는커녕 그 위에 다른 자료들로 더 깊어져만 간다. 그리고 자료들의 정리 중에 발견이 되어도 '혹시나' 나중에 사용될 가능성이 있을지 모른다는 막연한 기대라기보다는 불안감으로 다시 넣게 된다. 

 데이터들도 마찬가지이다. 아날로그 데이터들인 종이자료들이 나의 책상에서 십여 년이 넘도록 그 자리를 지키고 있는 것과 마찬가지로 수많은 데이터들이 우리의 기기 어디엔가에 쌓여있고 이를 처리하지 아니하고 시간이 지나면서 잊히면서 퇴적되어가고 있다. 우리 모두 같은 처지라는 것을 잘 알고 있다. 만일 이를 부정한다면 자신의 책상이나 책장을 보면 알 수 있다. 한 달이 넘어 한 번도 펼쳐보지 않은 것들이 이제 쌓여가고 있는 증거이다.  우리는 데이터가 많다는 것은 막연한 불안감으로 무엇인가 대비하여 쌓아 두려는 심리들이 있다. 마치 원시시대에 먹을 것을 쌓아두지 않으면 굶어 죽을지도 모르는다는 DNA가 남아있는 듯한 느낌처럼 그러하다. 우리에게는 데이터가 필요한 것이 아니라, 유용한 데이터가 필요한 것이다. 


2. 데이터에 대한 팩트

 개인적인 기준으로 유용한 정보를 데이터라고 정의한다. 일반적으로 산출되는 데이터를 데이터라고 하지 않는다. 또한 데이터는 시간과 장소, 사용자의 필요성에 따라서 데이터가 될 수도 있고 쓰레기가 될 수도 있다. 각각의 다양한 변수에 따라서 데이터는 대접이 확연하게 다르다. 

 일반적으로 발생되는 데이터는 시스코의 보고에 의하면 과거 2015년 기준으로도 64GB의 아이폰에 데이터를 꽉 채워 지구에서 달까지의 거리를 채우고도 남을 정도의 데이터가 발생된다고 한다. 단지 올해 발생된 데이터가 인류가 지금까지 만들어낸 문명의 데이터보다 해마다 많을 수 있다고도 한다. 즉 시간이 지날수록 센서에서 나오는 데이터와 우리 스스로가 사진을 찍고, 소셜을 하며, 유튜브를 보는 그러한 데이터가 나날이 몇 배씩 증가하고 있다는 의미이다. 그러나 그러한 데이터의 96%는 비즈니스에는 사용하기 어렵거나, 사용하기에는 너무 많고 다양해서 무겁거나, 개인정보나 기업이나 국가에 민감한 정보들로 사용하기에는 불가하다는 것이다. 데이터가 발생된다고 해서 모두가 데이터는 아니며 태생 때부터 사라질 운명을 가진 데이터들은 너무도 많지만 활용면에 있어서는 극히 제한적이라는 사실이다. 


3. 데이터의 활용과 문제

 '21C의 원유'라고 표현한 시스코의 표현은 '원유'에 방점이 있다. 가공을 해야 한다는 의미이다. 앞에서 언급했던 마윈 회장의 앞으로 30년은 DT, 데이터 테크놀로지의 시대라고 이야기하면서 마치 데이터를 중요하게 생각하지만 이미 그러한 개념은 누구나가 다 가지고 있는 것이고, 이제는 데이터보다 데이터의 가공에 대한 이야기를 더 중요하게 언급해야 사람들이 무엇이 중요한지에 대하여 오해를 하지 않을 듯하다. 이러한 이유로 데이터의 생성 이전에 어떠한 데이터를 생성할 것이며, 어떻게 활용할 것인가를 그려놓고 데이터를 생성하는 것이 가장 바람직하다는 것을 알고 있어야 데이터 활용에 대한 전략을 미리 점검하고 계획할 수 있다. 무 계획적으로 산출된 데이터는 필요 없는 데이터의 양산으로 너무도 많은 비용과  노력이 들어가게 되고 산출된 데이터의 활용에 대한 중압감으로 쌓아놓게만 되는 악순환이 반복된다. 

 양질의 데이터는 데이터를 활용한 인공지능 서비스의 결과가 양질의 서비스라는 것을 보증할 수 있다. 그러나 그 반대는 결과를 보증할 수 없다. 여기서 양질의 데이터라고 하는 것은 언급한 바와 같이 때와 장소, 요구사항에 따라 다르기 때문에 사용처의 고객으로부터의 요구사항이 첫 번째 필요데이터가 된다. 



4. 9번째 이야기를 마치면서...

 간단하게 데이터의 이야기를 했다. 구체적이고 전문적인 데이터에 관련한 이야기는 아니지만 가장 중요한 개념인 '유용한 데이터'와 '필요한 데이터'의 사전 설계가 필요하며 내가 생각한 데이터가 아니라 '고객에서부터 나오는 데이터'를 근본으로 하기를 바란다는 것이 핵심이었다. 또한 수많은 데이터가 버려지는 것에 대하여 데이터의 1% 더 활용하는 것이 중요하다는 생각을 해 보았다. 

 GE의 언급에서 보면 무엇인가 많은 일을 이루려고 하는 것보다 자신의 영역에서 1% 더 활용하는 것이 훨씬 더 현실적이고 구체적인 목표가 될 것이다. 데이터의 활용도 동일하다. 




  다음장에는 10번째 이야기로 현 기업들의 공통적인 특징인 플랫폼에 대한 이야기를 해봐야 한다. 이는 현재 기업들의 성장 동력으로 플랫폼을 생각하지 않고 비즈니스를 하는 기업은 없을 정도라서...... (10편에 계속) 

작가의 이전글 데이터가 비즈니스 확장의 키 (8)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari