brunch

You can make anything
by writing

C.S.Lewis

by 빅인 May 09. 2019

4차 산업혁명의 원유,
데이터를 다루는 역량에 대하여

(1) 빅데이터 시대 필수 역량인 '데이터 리터러시' 파헤치기




디지털 마케팅 시대에서 마케터의 역량으로 대두되는 '데이터 리터러시' 역량이라는 단어를 한 번쯤은 들어보셨을 듯합니다. 브런치의 첫 번째 글이었던 ‘디지털 마케팅 시대에서 마케터의 역할과 역량’에서도 데이터 리터러시에 대하여 잠깐 언급했었는데요. 이번 글과 다음 글에 거쳐서 데이터 리터러시란 무엇인지 조금 더 자세히 알아보도록 하겠습니다. 


제1편. 4차 산업혁명의 석유, 데이터를 다루는 역량에 대하여

            - 빅데이터 시대 필수 역량인 '데이터 리터러시' 파헤치기(1)

제2편. 방대한 양의 데이터를 한눈에 쉽게 보는 법이 궁금하다면? 

           - 빅데이터 시대 필수 역량인 '데이터 리터러시' 파헤치기(2)




개념) 데이터 리터러시란?


‘Data’와 ‘Literacy’의 합성어로 
‘데이터를 읽고 이해하고 분석하며 비판적으로 수용 및 활용할 수 있는 능력'


디지털 마케팅 시대에 넘쳐나는 데이터를 제대로 활용하기 위해서는, 무작정 데이터 수집만 하는 것이 능사가 아닐 것입니다. 목적 없이 수집된 데이터는 오히려 번잡함만 초래하고, 잘못된 데이터 해석은 잘못된 의사결정이라는 결과를 불러옵니다. 그렇기 때문에, 데이터 리터러시 역량은 비단 데이터 마케터뿐만 아니라 개인에게도 매우 중요한 역량이라고 할 수 있습니다.




데이터 리터러시 하위 역량


그렇다면, 목적에 맞는 데이터를 수집하고 이를 잘 활용하려면 어떻게 해야 할까요?

다음은 데이터 리터러시 하위 역량입니다.                    


1. 수집
2. 관리
3. 가공 및 분석
4. 시각화
5. 해석


각각이 뜻하는 것이 무엇인지, 

이를 잘 갖추지 못하면 어떤 일이 일어나는지 하나씩 살펴보도록 하겠습니다. 



#1 수집


데이터 분석의 시작이라고 할 수 있는 단계, 바로 필요한 데이터를 모으는 "데이터 수집" 단계입니다. 


그런데 데이터 수집에 착수하기에 앞서 선행되어야 할 중요한 단계가 있습니다. 바로 데이터의 활용과 분석의 목적을 분명하게 하는 것인데요. 분석을 통해 확인하고자 하는 사항은 무엇인지 미리 생각해야 수집할 데이터와 방법을 설계할 수 있기 때문입니다. 목적이 없이 축적만 된 데이터는 비즈니스에 아무런 도움도 주지 못하고 컴퓨터의 용량만 잡아먹는 애물단지로 전락하기 십상이겠죠?


예를 들어보겠습니다.

한 놀이공원의 마케팅 담당자 A 씨는 마케팅 전략을 펼치기 이전, 현재 매출 현황은 어떤지 궁금했습니다. 이를 위해 지난 3년 간의 매출 정보 데이터를 수집해야겠다고 마음먹었습니다. 

매출 데이터를 수집하다 보니, 예상보다 그 양이 너무 방대해졌습니다. 고민하던 A 씨는 일별 매출 데이터가 아닌 월별로 묶어서 수집하기로 결정했습니다.


혹시 문제를 눈치채셨나요?

놀이공원이라는 특성상, 평일보다는 주말에 더 많은 매출이 발생할 것입니다. 이에 대한 고려 없이 매출 데이터를 일 단위가 아닌 월 단위로 수집하기로 설계한다면, 평일과 주말의 매출 차이를 확인할 수 없게 됩니다. 설계 단계에서의 오류가 발생한 것입니다. 목적에 맞는 데이터를 제대로 수집하기 위해서는 올바른 수집 설계부터 이루어져야 함을 보여주는 예시입니다.


[그림 1] 데이터의 활용은 놀이공원 마케팅에도 활용될 수 있습니다.


#2 관리


수집된 데이터를 분석이 가능한 형태로 구조화하고 정제하는 단계입니다. 


많은 분들이 인지하고 계시다시피, 관리 단계에서도 기술적인 역량이 요구되는데요. 체계화되지 않은 데이터 관리 때문에 중요한 정보를 잃는 불상사가 발생하기도 합니다. 이를 막기 위해서는 수집 데이터를 보호하기 위해 어떤 조치를 취해야 하는지에 대한 전략을 세우고 데이터를 관리하는 능력이 필요합니다.


놀이공원 마케터 A 씨의 예시로 돌아가 보겠습니다. 수집된 데이터를 관리하던 A 씨는, 전체 데이터 중 매출 데이터만을 사용하게 될 것이라 지레짐작하여 날짜와 매출을 제외한 모든 데이터를 지워버렸습니다. 그런데 데이터를 가공하던 A 씨는 매출의 형태가 유난히 높은 날과 그렇지 않은 날이 매우 들쑥날쑥하게 섞여있음을 알 수 있었습니다. 매출에 영향을 미치는 요소들이 무엇일까 궁금했지만, 이미 모든 데이터를 지워버린 이후라 확인할 수 없었습니다.


매출에 영향을 미치는 데에는 날씨, 놀이공원 내 페스티벌 유무, 인기 놀이기구 운영 여부 등 다양한 요인이 존재합니다. 사용하지 않는 데이터라고 해서 섣불리 지워버리기보다는, 가능하다면 가공하지 않은 원본 데이터를 지니고 있는 것도 좋은 방법입니다.



#3 가공 및 분석


목적에 맞는 분석 방법으로 데이터를 분석하여 결과를 도출해내는 단계입니다. 

‘구슬도 꿰어야 보배’라는 말처럼, 데이터도 제대로 가공하고 분석할 때 비로소 의미를 지닐 수 있습니다. 


역시 예시를 들어보겠습니다. 

지난 3년 간의 매출 데이터를 모은 놀이공원 마케터 A 씨는 이제 업무에 활용하기 위해 데이터를 가공할 계획을 세웁니다. 3년 치 데이터를 모두 보기에는 시간이 너무 많이 지나버린 것 같아, 최근 4개월 간의 데이터만 추출하기로 결정합니다. 

2018년 12월부터 2019년 2월까지의 놀이공원 매출 데이터를 평일과 주말로 나누어 평균 내어 보았습니다. 그런데, 평균값이 2019년 3월 한 달 매출의 40% 정도밖에 되지 않았습니다. 


최근 데이터라는 이유만으로 충분하지 못한 데이터를 가공하여 결과를 도출해버린다면, 동절기(비수기)와 성수기의 매출 차이를 고려하지 못하게 됩니다. 단적인 예시이지만 데이터를 다루는 실무에서 빈번하게 나타날 수 있는 문제이므로 경계해야 하는 부분입니다.



#4 시각화


데이터를 한눈에 알아보기 쉽도록 그래프, 차트 등의 형태로 표현하는 단계입니다.


시각화 단계에서는 다양한 그래프 중 주제와 목적에 맞는 것을 선정하여, 데이터를 왜곡 없이 나타내는 것이 중요합니다. 


이 단계에 대해서는 설명할 부분이 많아, 다음 글에서 더욱 자세히 알아보도록 하겠습니다. 



#5 해석


아무리 잘 뽑아낸 데이터라 할지라도, 결과만 보고 이를 활용할 계획을 세우지 못한다면 공을 들여 분석한 데이터의 의미가 사라질 것입니다. 바로 이 해석 단계가, 데이터 분석 결과물을 활용하기 위한 계획을 세우는 중요한 단계입니다.


다시 예시입니다.

데이터 분석 결과를 통해 A 씨는, 다음과 같이 결과를 시각화해보았습니다.


[그림 2] 놀이공원 맥주 판매량 데이터 예시


A 씨는 해당 연도에만 특이하게 나타나는 점에 주목했습니다. 7월 초를 기점으로 놀이공원 내 맥주 판매량이 급격하게 증가한 것입니다. 이 시기의 사회적 요인을 조사해보았더니, 7월 2일부터 주 52시간 근무제가 시행되고 있었습니다. 데이터 분석을 시작하기 전에는 놀이공원에 가족단위 고객이 가장 많을 것이라고 생각했던 A 씨는 의외의 결과를 발견한 것입니다.


[그림 3] 놀이공원 맥주 판매량 데이터와 사회적 요인의 상관관계 예시


A 씨는 데이터 분석으로 얻은 결과를 토대로, 새로운 타깃인 직장인을 상대로 하는 마케팅을 기획하기로 결정했습니다. 


“주 52시간 근무가 시행되자, 놀이공원의 음식 카테고리 중 맥주의 판매량이 늘었다.”

→ 퇴근 후 여가시간이 많아진 직장인들을 상대로 하는 마케팅을 실시해보자.


A 씨는 직장인들에게 야간 입장권을 50% 할인해주는 이벤트를 실시했습니다. 또한 야외 가든에서 맥주와 함께 즐길 수 있는 안주를 보완하고, 음악을 연주하는 ‘한여름밤의 맥주 페스티벌'을 기획하였습니다. 그 결과, 입장권 판매량과 맥주 판매량을 230% 성장시킬 수 있었습니다. 




글을 마치며


이상으로 데이터 리터러시의 개념과 하위 역량을 살펴보았는데요. 데이터는 4차 산업혁명의 원유라고 불릴 정도로 필수적인 존재가 되었습니다. 데이터 중심 사회에서 경쟁력을 지니기 위해서는 데이터 리터러시 역량을 갖추어야 합니다. 


수집부터 해석까지 모든 단계에 거쳐 가장 중요한 부분은, 환경을 고려하는 사고방식입니다. 단적으로 보여드렸던 놀이공원 마케터 A 씨가 범한 오류들도, 산업과 환경에 대한 전반적인 이해가 부족했기 때문이라고 할 수 있습니다. 


이번 글이, 독자분들께서 산업 환경을 고려하는 사고방식을 지니는 것과 더불어, 데이터 해석 역량을 갖추는 시작이 되었기를 바랍니다. 


다음 글은 데이터를 시각화하는 방법에 대해 조금 더 자세히 알아보겠습니다. 


(위의 모든 사례는 이해를 돕기 위한 가정입니다. 실제 사례가 아님을 알려드립니다.)




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari