<데이터로 보는 커피 소비 트렌드> 콘텐츠 가이드
'데이터 리터러시(Data Literacy)'에 대해 들어보신 적이 있나요? 데이터 리터러시는 데이터를 활용하는 전 과정에서 데이터를 이용하고 해석해, 이를 목적에 맞게 활용하는 것을 의미합니다. 데이터 시각화가 방대한 양의 데이터를 시각적으로 표현해 한눈에 데이터의 의미를 발견할 수 있도록 돕는다면, 데이터 리터러시는 기술적으로 데이터를 다루고 시각화하는 것에서 나아가 데이터에서 유의미한 인사이트를 발굴해내는 넓은 개념의 데이터 활용 역량입니다.
지난주 커피를 주제로 한 시각화 콘텐츠 <그 많은 커피는 다 어디에서 왔을까? - 데이터로 보는 커피 수입 트렌드>(이하 '데이터로 보는 커피 수입 트렌드')를 발행하며 콘텐츠 가이드도 함께 공개하였습니다. 이후 '잘 만들어진 데이터 시각화 결과물이 있더라도 이를 데이터 리터러시에 따라 다르게 해석될 수 있으므로, 독자에게 또 하나의 장벽이 있는 것은 아닌가요?'라는 질문을 받았습니다. 사실 콘텐츠 가이드를 작성하여 공개한 목적이 여기에 있습니다. 바로 독자가 시각화 콘텐츠를 '탐색적으로' 읽으면서 다양한 인사이트를 발견할 수 있도록 도움을 주기 위해서였고, 이를 콘텐츠를 통해 데이터 리터러시를 경험하는 과정으로 볼 수 있습니다.
이번에는 커피를 주제로 한 시각화 콘텐츠 두 번째 이야기로 <커피를 대하는 우리의 태도 - 데이터로 보는 커피 소비 트렌드>를 공개하며 시각화 콘텐츠로 데이터 리터러시를 경험하는 방법을 이야기해보고자 합니다.
우리는 어떻게 커피를 소비하고 있을까요? 우리의 커피 소비 행태를 데이터로 볼 수 있는 방법은 무엇일까요? 데이터 리터러시에서 기술적으로 데이터를 다루는 것만큼이나 중요한 것은 데이터 기반으로 문제 자체에 접근할 줄 아는 시각을 갖는 것입니다. 우리가 커피를 소비하고 있는 모습을 알 수 있는 구체적인 질문으로 언제, 어디에서, 얼마나 많은 커피를 마실까? 등을 떠올릴 수 있고, 이를 어떤 데이터로 확인할 수 있을지를 고민해보아야 합니다. 관련하여 공개된 공공데이터가 있는지, 외부 기관 조사 결과가 있는지 등을 찾아볼 수도 있고, 활용할만한 데이터가 없다면 직접 데이터를 수집하는 것도 하나의 방법이 될 수 있습니다.
이를 확인할 수 있는 데이터를 찾았다고 가정해보죠, 우리는 왜 데이터로 문제를 보고, 이야기해야 할까요? 바로 직감이 아닌 정확한 근거를 바탕으로 이야기하기 위함입니다. 정확한 근거가 되어줄 데이터에서 '이야기'를 발굴하는 데의 기본은 가설 검증입니다. 쉽게 이야기하면 데이터에서 찾고자 하는 의미를 위해 '질문'을 떠올려보는 것입니다. 그리고 '질문'에 대한 '답'을 확인하는 것이지요! 우리는 질문에 대한 답을 찾는 과정을 통해 인사이트를 도출하게 됩니다. 이를 데이터 리터러시라고 할 수 있는 것이고요!
<데이터로 보는 커피 소비 트렌드> 콘텐츠의 첫 번째 부분은 6가지 질문과 그 답을 알 수 있는 시각화 차트로 우리의 커피 소비 행태를 알아봅니다.
질문 1 : 커피를 얼마나 마시고 있나요?
질문 2 : 커피를 마시는 장소는 어디인가요?
질문 3 : 커피를 마시는 시간대는 언제인가요?
질문 4 : 커피를 마시는 구체적인 상황은 언제인가요?
질문 5 : 자주 마시는 커피 유형은? ex) 캔커피, 에스프레소 머신으로 내린 커피, 캡슐 커피 등
질문 6 : 좋아하는 커피 종류는 무엇인가요? ex) 아메리카노, 카페라떼, 카푸치노 등
콘텐츠를 읽기 전 6가지 질문에 대한 자신의 답 혹은 예상 답안을 미리 생각해보고, 실제 데이터와 맞는지 시각화 차트를 이용해 확인하면서 콘텐츠를 읽어보세요.
자신의 답과 일치하는 것은 무엇이고, 예상치 못한 결과가 있는지 등을 확인하는 과정은 가설 검증의 과정으로 볼 수 있고, 이 과정을 통해 각자 개인에게 의미 있는 인사이트를 찾을 수 있을 것입니다.
빅데이터 분석이라는 이름으로 다양한 소셜 데이터를 활용한 다양한 주제의 데이터 분석 결과를 접해보신 적이 한 번쯤은 있으리라 생각됩니다. 검색 포털, SNS 등을 통해 수집된 데이터를 의미하는 소셜 데이터는 사람들의 관심도를 판단하는 데이터 지표로 활용되고 있는데요. 주로 사람들이 어떤 키워드를 얼마나 많이 검색했는지, 특정 키워드와 함께 쓴 연관 키워드는 무엇인지를 지표로 활용하여 현상을 분석합니다.
커피와 관련된 사람들의 관심사를 알아보기 위해 네이버 데이터랩을 통해 키워드 검색량 데이터를 수집 및 시각화해보았습니다. 커피 용품과 관련된 키워드의 쇼핑 클릭수가 증가하는 추세를 보이고 있음을 시각적으로 확인할 수 있습니다.
데이터 리터러시와 관련하여 여기에서 중요한 점은 데이터 시각화 자료를 이해하고 해석함에 있어서 데이터의 출처뿐만 아니라 해당 지표의 정확한 개념을 이해하는 것입니다. 이를 통계 리터러시라고 지칭하는 경우도 있습니다. 위 이미지상 시각화 결과물의 데이터는 네이버 데이터랩을 출처로 하며, 해당 지표는 네이버 쇼핑 클릭수를 의미합니다. 대부분의 소셜 데이터 분석 결과에서 키워드 검색량, 혹은 언급량을 주로 활용하기 때문에 '데이터 출처' 정보를 관심 있게 살펴보지 않으면 '아, 커피 용품 관련 키워드 검색량이 증가했구나!'라고 오해할 수 있습니다. 여기서 활용된 '네이버 쇼핑 클릭수' 지표는 쇼핑이라는 직접적인 행위와 관련된 채널에서의 관심도를 확인할 수 있는 지표로서 '구매가 가능한 키워드'의 관심도를 판단하는데 일반적인 포털 키워드 검색량보다 더 적합하다고 이야기할 수 있습니다.
뿐만 아니라 해당 지표는 데이터 수집 기간 내 최댓값을 100으로 계산한 상대 지표임을 이해할 필요도 있습니다. 각 키워드별 데이터는 데이터 수집 기간 가운데 가장 쇼핑 클릭수가 많았던 시점을 기준으로 무조건 1번은 '100'이라는 값을 갖습니다. 각 키워드별 쇼핑 클릭 수의 절댓값을 시각화한 것이 아니기 때문에, 키워드별로 클릭수가 많고 적음을 비교하기보다는 키워드 개별적으로 점차 클릭수가 증가하는 추세를 보이고 있음을 확인해야 합니다. 참고로 위 시각화 차트는 데이터 수집 기간 동안 쇼핑 클릭 수의 추이 변화를 확인하기 위해 월별 데이터를 분기별로 합산한 것도 참고해볼 필요가 있습니다.
지금까지 <데이터로 보는 커피 소비 트렌드> 콘텐츠를 읽기 이전에 데이터 리터러시의 관점에서 생각해보아야 할 점을 이야기했습니다. 이 역시 시각화 콘텐츠에서 데이터를 탐색하고 의미를 도출해내는 적극적인 콘텐츠 구독 방법이라고 이야기할 수 있습니다. 지난번 <데이터로 보는 커피 수입 트렌드> 콘텐츠에 대한 뜨거웠던 반응에 이어 이번에도 많은 분들이 시각화 콘텐츠를 '파헤쳐 가며' 재미있는 인사이트를 발견하시길 바라보면서, 여러분을 <데이터로 보는 커피 소비 트렌드> 콘텐츠로 안내합니다:)
* 이 글의 원문 출처는 뉴스젤리 블로그 '[데이터 시각화] 데이터에서 이야기 찾기! <커피를 대하는 우리의 태도 - 데이터로 보는 커피 소비 트렌드> 콘텐츠 가이드'입니다.