brunch

You can make anything
by writing

C.S.Lewis

by MODUDASS Nov 24. 2021

포스트 코로나! 빅데이터 이해하기!

포스트 코로나 시대를 대비하기 위한 생존전략 핵심 빅데이터 이해하기!


스마트폰의 발달과 정보통신의 발달로 이 시대를 살아가는 우리의 경우 의식을 하지 못한 사이에 4차 산업 혁명의 핵심 기술들 혹은 미래를 선도할 기술들과 앞으로 미래를 예측할 수 있는 힌트들이 이미 방송을 비롯한 다양한 매체를 통해 우리에게 많이 보급되어 있습니다.


다만 우리가 그렇게 알게 모르게 들었던 미래 기술들 혹은 미래 먹거리의 경우 당장의 나의 현실과는 전혀 별개로 인식되기 때문에 사실 정확하게 그 의미와 활용방안에 대해서 파악하는 사람은 그렇게 많지 않았을 것 같습니다.


저 역시도 이러한 과학 기술 분야에서 현재 일을 하고 있는 한 사람으로서 일하면서도 정확한 의미나 향후의 활용방안에 대해서 이해를 할 뿐이지 조사를 하거나 분석을 해 본 적은 따로 없었고 남들이 쓰는 용어 그리고 썼을 때 누군가에게 그냥 설명하기 좋은 하나의 단어 정도로만 생각했습니다.


이번 7화에서 소개해 드릴 포스트 코로나 즉, 코로나 이후 시대에 반드시 필요하며 우리의 생존 전략을 위해 반드시 알아야 하는 '빅데이터'에 대해 설명을 드리고자 합니다.


빅데이터(Big data)는 직관적으로 직역하자면 큰 데이터 혹은 아주 많은 데이터입니다.





그럼 왜 굳이 전문가들은 기존의 data들을 굳이 '빅'이란 단어까지 사용해 가면서 '빅데이터'라고 명명했을까요?


그 이유는 첫 번째로 우리가 개념적으로 데이터 혹은 자료 수준이 아니라 전산화하여 표현할 수 있는 모든 문자, 수치, 영상, 그림 등 결국 디지털화하여 표현할 수 있는 모든 데이터를 총칭해야 하기 때문입니다.


예전에 데이터 혹은 자료들은 개인의 경우 개인 PC 혹은 USB와 같은 저장 매체 그리고 기업의 경우는 각 기업이 가지고 있는 전산화 장비에만 저장하여 축적하던 시대에는 보유한 데이터의 양이 중요했습니다.


하지만 점차 구글, 야후, 네이버 등과 같은 검색 엔진의 발달과 클라우드 시스템의 발달 그리고 사물인터넷 등이 발달하면서 하루에도 수만, 수억 가지가 넘는 엄청난 규모의 데이터가 생성되면서 단순한 개인 혹은 기업 차원에서의 전산 장비 혹은 시스템으로는 수용이 되지 않는 수준이 되어갔습니다.


엄청나게 다양한 그리고 방대한 양의 데이터가 시시각각 생성되고 소멸되는 과정 속에서 데이터들 간의 상관관계를 분석하고 그 속에서의 공통점 혹은 규칙성을 발견하는 과정을 통해 어떠한 목적을 가지고 있는 사용자가 이런 가공된 정보를 활용한다면 마치 이것은 '신의 계시' 혹은 '미래 예언' 수준의 정확한 전망과 예측이 가능해지게 됨을 알게 되었고 많은 전문가와 사람들은 이러한 가공된 데이터를 활용해 사업에 활용함은 물론 개인들의 의식주, 소비 패턴 등에 활용하기 시작했습니다.


따라서, 빅데이터의 두 번째 중요한 의미는 단순히 많은 양의 데이터를 지칭하는 것이 아니라 수많은 다양한 데이터가 비로소 어떠한 목적에 맞게 가공되고 이를 활용할 수 있는 데이터가 되었을 때 우리는 이것을 빅데이터라고 부를 수 있습니다.


따라서 빅데이터들의 특징은 데이터의 규모, 다양성, 생성 속도에서 더 나아가 최근 가치 및 진실성으로 확장되어 가고 있으며 빅데이터 분석을 통해 목적에 맞는 최적의 답안을 제시함으로써 새로운 가치를 창출하고, 기존의 패턴 분석을 기반으로 향후 사건 및 현상에 대한 예측 및 대응을 가능하게 합니다.


이러한 이유로 이미 금융업과 제조업을 중심으로 빅데이터 기술이 적극적으로 활용되고 있으며 정부 및 전문 서비스 업종에도 도입이 속속 이루어지고 있습니다.


글로벌 빅데이터 및 분석 시장은 2016년부터 연간 11% 이상의 평균 성장률을 보이고 있으며 점차 이러한 성장률의 추세는 급격히 성장하는 추이를 보이고 있습니다.


최근 코로나로 인해 급격한 변화를 예측하고 변화하는 수요에 대응하기 위해 빅데이터를 활용하여 이미 앞선 기업들은 코로나 발 불황이라는 시장에서 유유히 코로나 발 호황을 만들어가며 시총을 몇십 배씩 증가시켜가며 발전해 가고 있습니다.


결국 코로나가 이러한 빅데이터의 활용 시장을 급격하게 앞당겨 왔고 코로나 이후에 우리가 생존하기 위해서는 이러한 빅데이터를 활용하지 못한다면 뒤쳐질 수밖에 없는 상황이 온다고 이미 전문가들은 이야기하고 있습니다.


저 역시도 얼마 전까지만 해도 '그래서 어쩌라고?', '나도 활용하고 싶은데 돈이 없어~', '빅데이터 활용해서 될 만한 일을 나는 하지 않아~' 등 뭔가 빅데이터를 활용할 수 있는 여러 방안에 대해서 생각하고 고민해 보진 않고 그냥 마냥 귀찮아서 핑계 아닌 핑계를 만들었던 것 같습니다.




그럼 빅데이터를 어떻게 일반 사람들이 활용하면 좋을까요?


사실 공부하고 정리를 해보니 너무나도 활용성이 많아 모두 설명드리기는 어려울 정도로 많지만 이 글을 쓰는 가장 큰 이유가 누구나가 쉽게 이해하고 활용하는데 그 목적을 두었기 때문에 가장 간단한 몇 가지 현실적인 활용방안에 대해 이야기해 보겠습니다.


먼저 저도 현재 운영하고 있는 네이버를 비롯한 티스토리 혹은 구글 블로그입니다.


블로그를 그냥 단순하게 개인 일기로 활용하는 분들도 많겠지만 많은 분들은 일일 방문자를 통한 '애드포스트', '구글 애드센스' 혹은 '제휴 마케팅'을 통한 수입의 활용 목적이 있을 수 있습니다.


하지만 애드포스트 건 제휴 마케팅이건 방문자가 많아야 선정이 되고 수입이 들어오는 구조다 보니 방문자를 늘리기 위한 여러 활동을 하게 됩니다.


최근 네이버 데이터 센터를 비롯해 많은 검색 엔진들은 이미 키워드 검색을 바탕으로 한 빅데이터를 제공하고 있습니다.


결국 똑같은 시기에 시작한 두 명에 블로그가 있다고 가정하고 1명은 10일 만에 일일 방문자가 1000명을 돌파하는데 나머지 1명은 몇 달이 지나도 일일 방문자가 100명을 넘지 못한 경우가 있다고 가정해 봅시다.


그럼 둘의 가장 큰 차이는 무엇일까요?


바로 내가 관심 있는 것이냐? 남들이 관심 있어하는 것이냐? 의 문제이며 이는 결국 키워드 문제로 이어집니다.


네이버를 포함한 구글 등은 최근 일주일 혹은 시간대별 급등하는 검색어 혹은 상위 랭크되는 검색어들을 찾아볼 수 있는 기능들이 있습니다.


결국 남들이 궁금해할 만한 키워드를 바탕으로 글을 쓴다면 그만큼 많은 사람들의 검색에 노출되게 되고 많은 방문자 유입을 이룰 수 있게 됩니다.


두 번째 예로 만약 어떤 사람이 가게를 운영한다고 가정할 경우, 최근 사람들이 쇼핑몰 사이트를 활용해 어떠한 키워드를 많이 검색하는지? 혹은 매년 반복되는 계절이나 시즌에 많이 검색되었던 키워드는 무엇인지? 등을 확인할 수 있고 이렇게 많이 검색되는 키워드들을 바탕으로 상품을 전면에 배치하거나 홍보를 준비하게 된다면 수익 창출에도 빅데이터를 활용할 수 있게 됩니다.


최근 부업으로 많이 활용하시는 네이버 스마트 스토어나 쿠팡 파트너스 역시도 이러한 상위 키워드 검색을 잘해서 상품이 전면에 배치되거나 많은 검색이 일어날 수 있게 빅데이터를 활용하는 사람과 단순히 글의 양으로만 하루에 몇 개의 홍보글을 쓰기만 하는 사람과의 매출 혹은 수익의 차이는 극명하게 갈라질 수밖에 없고 큰 격차를 불러올 수밖에 없습니다.


이처럼 이미 많은 IT 공룡 기업들은 각자의 빅데이터 플랫폼을 활용해 가깝게는 쇼핑, 영화 혹은 콘텐츠 추천부터 사업적으로는 대리점 및 구매자들에게 정보를 제공해 관리 비용 절감과 최적화된 운영 그리고 향후 고장 발생 시 원인 분석까지 제공하기 때문에 일반인들의 경우, 빅데이터를 활용한 분석이나 플랫폼을 만들기보다는 잘 분석되어 오는 정보들을 나의 생활에 어떻게 활용할 지에 대해 잘 생각해 활용한다면 포스트 코로나 시대에 보다 능률적인 업무와 효율적인 사업이 가능할 것으로 생각됩니다.



매거진의 이전글 포스트 코로나! 클라우드 이해하기!
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari