데이터를 시각화하는 사람들은 어떻게 일할까?
자신이 잘 알지 못하는 분야가 궁금할 때, 여러분은 어떻게 하시나요?
데이터 시각화 분야가 궁금할 경우, ‘데이터 시각화 업계 현황이 어떻게 되나요?’, ‘어떻게 해야 데이터 시각화를 잘할 수 있죠?’ 등의 질문을 던져 볼 수 있겠어요. 또, 유경험자를 찾아 조언을 구하기도 할 테고요. 이번 콘텐츠에서는 데이터 시각화에 관심이 있어 업계 현황, 업무 방식 등의 궁금증을 갖고 계신 분들을 위해 2022년 데이터 시각화 분야 종사자들을 대상으로 진행한 설문조사 결과를 나눠 보려고 해요. 여러분이 누구보다 먼저 이 소식을 접하실 수 있도록 뉴스젤리가 발 빠르게 가져왔어요!
최근 해외의 데이터 시각화 비영리 단체인 데이터 시각화 소사이어티(Data Visualization Society, DVS)에서 2022년 9월 1일부터 10월 8일까지 데이터 시각화 업계 현황을 설문 조사한 결과를 발표했습니다. DVS는 데이터 시각화 분야를 육성하기 위해 커뮤니티 운영, 대회 개최 등의 다양한 활동을 진행하는 단체인데요! 이번 설문조사는 데이터 시각화 분야의 현황, 데이터를 시각화하는 사람들, 그들이 직면한 문제에 대한 이해를 목표로 진행했으며, 총 1,568명의 ‘비주얼라이저(visualizer)’가 참여했습니다. (설문조사에서는 데이터 시각화를 하는 사람들을 비주얼라이저(visualizer)라고 칭합니다! 이번 글에서도 비주얼라이저라는 용어를 사용할게요.)
설문조사는 총 78개의 문항으로, 비주얼라이저의 인구통계학적 특성, 업무 분야, 작업 과정 등에 대한 응답 결과로 구성되어 있는데요! 이번 글에서는 그중에서도 데이터 시각화 분야의 사람들이 어떻게 일하는지 궁금한 분들을 위한 내용만을 선정해 번역 및 해석했습니다. 그 결과를 함께 알아볼까요?
데이터와 관련된 직업을 떠올리면 데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어 등을 떠올리기 마련입니다. 하지만 데이터 시각화와 관련된 직업을 떠올리면 쉽사리 한 단어가 떠오르지 않죠? 그렇다면, 데이터 시각화를 업무에서 사용하는 사람은 어떤 분야에서, 어떤 직업을 가지고 일하고 있을까요?
설문조사에 참여한 비주얼라이저 중 회사를 다니는 사람들을 대상으로 산업군과 직무를 조사한 문항이 있었어요.
위 시각화의 x축은 응답자가 다니는 회사의 산업군을, y축은 응답자의 직무를 나타낸 히트맵입니다. 응답자가 많을수록 네모 박스의 크기를 크게 표현했습니다. 공공기관부터 헬스케어 분야까지 다양한 산업군에 비주얼라이저가 분포해 있음을 알 수 있어요.
직무별 분포를 보면, 저널리즘을 제외한 모든 산업군에서 분석가(Analyst)가 가장 큰 비중을 차지한다는 사실 또한 알 수 있습니다. 그 뒤를 이어 팀장, 매니저, 고위 관리직 등의 직업을 의미하는 리더십(Leadership) 항목이 두 번째로 큰 비중을 차지했는데요! 팀 및 팀원의 성과 관리 모니터링을 위해, 혹은 팀의 성과를 전사적으로 보고하기 위해 시각화를 활용할 수 있기 때문이에요. 이외에도 디자이너, 개발자, 과학자의 비중이 상대적으로 높은 것도 눈에 띕니다. 데이터를 직접적으로 다루는 데이터 분석가 이외의 직무를 갖고 있는 사람도 시각화 작업을 하고 있다고 해석해 볼 수 있겠어요.
효과적인 데이터 시각화 차트를 만들기 위해서는 데이터 기획부터 분석, 시각화, 디자인까지 여러 단계와 다양한 관점이 고려되어야 합니다. 따라서 시각화 제작 과정에서는 예상치 못한 여러 문제를 직면하게 되기도 합니다. 과연 비주얼라이저들은 어떤 어려움을 겪었을까요?
위 시각화는 비주얼라이저가 데이터 시각화 작업에서 겪는 어려움 3가지를 묻는 질문에 답한 결과 데이터를 표현한 워드클라우드입니다. 글자의 크기가 클수록, 색깔이 청록색에 가까울수록 응답 수가 많다는 것을 의미합니다. 무려 52%의 응답자가 데이터 시각화 작업에 있어서 ‘시간 부족 (Lack of time)’을 가장 큰 어려움으로 뽑았습니다. 그 뒤를 이어 ‘새로운 도구와 접근법 익히기 (Learning new tools/approaches, 37%)’,‘시각화 이외의 활동에 너무 큰 노력을 기울이는 것 (Too much effort spent on non-viz, 36%)’, ‘데이터 엑세스 (Accessing data, 35%)’를 문제로 꼽았어요.
그렇다면, 비주얼라이저는 어떤 이유로 시간 부족을 가장 큰 문제로 꼽은 걸까요? 데이터 시각화 작업 중 가장 많은 시간이 소요되는 과정이 무엇인지 알 수 있다면, 그 이유를 추측해 볼 수 있지 않을까요? 데이터 시각화 작업 과정을 6가지(아이데이션, 데이터 준비, 데이터 분석, 시각화 제작, 작업 관리, 기타 작업)로 나누고, 최근 주간 근무 동안 각 작업에 얼마나 많은 시간을 할애했는지 묻는 질문의 응답 결과를 살펴보겠습니다.
위 시각화는 최근 주간 근무 중 시각화 세부 작업별 소요 시간을 표현한 레이더 차트입니다. 응답은 세부 작업 6가지로 구분되며, 맨 위에서부터 시계 방향으로 긴 소요 시간을 의미하는데요. 예를 들어 첫 번째 항목인 아이데이션 (Ideating)의 경우 ‘5시간 이하 (5 hours or less)’라는 답변에 도형이 가장 많이 치우쳐 있어, 이 답변을 가장 많은 응답자가 선택했다는 것을 알 수 있습니다.
6가지 작업별 소요 시간에 대한 설문 결과 응답자들은 ‘시각화 제작 (Producing Viz)’에 가장 많은 시간을 소비한다고 말했으며, 그중에서도 일주일에 약 11~20시간을 사용했다는 응답이 모든 과정 중 가장 높은 18%를 기록했습니다. 그렇다면 왜 유독 ‘시각화 제작’에 많은 시간을 소비하는 것일까요? 이 이유에 대해 시각화 기획자 뉴스젤리 강원양 팀장님께 질문했고, 답변을 통해 그 이유를 추측해 볼 수 있었어요.
"시각화를 업으로 하는 사람으로서 추측해 보면, 시각화를 보는 사람은 누구인지, 시각화를 통해 전달하고자 하는 메시지와 그 목적이 무엇인지에 따라서 시각화의 형태는 달라지는데, 이를 위한 다양한 시도가 이루어지기 때문일 것이에요. 시각화 제작을 위해서는 차트 유형, 컬러, 범례 등 차트의 형태와 관련된 요소 뿐만 아니라 데이터 탐색을 위한 인터랙티브 요소의 설계 등 종합적으로 고려해야 할 요소가 많습니다. 이와 같은 시도를 함에 따라 소요되는 작업 시간이 늘어나기는 하지만, 데이터를 효과적으로 전달하기 위한 최선의 방안을 찾는 과정, 그리고 그 과정 속 새로운 시각화 형태를 고민하고 시도하는 것은 시각화를 업으로 하는 사람에게는 흥미로움이 가득찬 시간이라고 생각해요!"
물론 사람에 따라 의견이 다를 수 있겠지만, 데이터 시각화 분야 종사자로서의 답변이니 참고하시면 좋겠어요!
데이터 시각화를 제작하기 위해 활용할 수 있는 시각화 툴은 생각보다 다양한데요! 처음 데이터 시각화를 접하시는 분은 어떤 툴을 사용해야 할지 난감하실 수도 있을 것 같아요. 비주얼라이저가 많이 쓰는 툴을 참고해서 본인의 필요에 잘 맞는 툴을 찾아보는 건 어떨까요?
위 시각화는 비주얼라이저를 대상으로 한 데이터 시각화 툴의 사용 여부 조사 결과를 표현한 100% 세로 누적 막대 차트입니다. 각 툴을 의미하는 조각이 막대에서 차지하는 비율을 보면 마이크로소프트(Microsoft)의 엑셀(Excel)과 태블로(Tableau)가 4년 연속 1, 2위를 차지하면서, 가장 많은 사람이 사용하는 툴이라는 사실을 알 수 있습니다. 데이터 활용 분야에서 가장 대표적인 엑셀과 데이터 시각화 BI 솔루션으로 가장 대표적인 태블로가 1, 2위를 차지한 것을 통해 대중적인 툴의 사용이 활성화 되어 있음을 짐작해 볼 수도 있겠습니다. 파워포인트(PowerPoint)와 구글 시트(Google Sheets)는 각각 2021년, 2022년부터 설문 항목으로 추가된 후 큰 사용 비율을 차지하는 것을 확인할 수 있네요. 마이크로소프트의 파워 BI(Power BI)는 2019년부터 점점 사용 비율이 상승하면서, 2022년 기준 4위를 차지했어요. 반면 R의 경우 지속적으로 사용 비율이 줄어들고 있습니다.
하지만, 툴에 대한 선호도를 조사해 보니 조금 다른 결과를 확인할 수 있었습니다.
위 산점도 시각화는 x축에 해당 툴을 사용한다고 응답한 사람의 수를, y축은 해당 툴에 대한 선호도 점수를 표현합니다. 이전 문항과 다르게 이번에는 각 툴이 속한 상위 카테고리의 선호도를 고르는 문항이었어요. 따라서 엑셀은 마이크로소프트로, 태블로는 other로 구분되었다는 점을 고려하여 차트를 해석해야 합니다. 설문 결과 엑셀, 파워포인트가 속한 마이크로소프트의 툴은 사용자 수에 비해 선호도가 떨어지는 편이었어요. 반면 R의 경우 사용량에 비해 높은 선호도를 보였습니다. 또, 재미있게도 펜과 종이가 가장 높은 만족도를 보였네요!
한편, 데이터 시각화를 만들기 위해서는 어떤 툴을 사용하느냐보다도 어떤 역량을 갖춰야 할지가 더 중요하다고 볼 수 있는데요. 비주얼라이저들은 데이터 시각화 기술을 익히고 역량을 키우는 데에 어떤 방법이 가장 유용하다고 꼽았을까요?
설문 결과 프로젝트를 통한 작업(Working through a project)과 예제 분석, 실습 (Examples)이 가장 도움이 된다는 응답이 4년째 1, 2위를 차지했습니다. 공통적으로 실습을 통해 익히는 것이 유용하다는 의견이네요! 데이터 시각화 툴에 대한 기초 사용법은 누구나 쉽게 익힐 수 있으나, 이를 실제로 적용하는 것은 쉽지 않습니다. 튜토리얼의 경우 툴의 각 기능은 잘 설명해 주지만, 이를 실제 실무에서 활용하기 위해서는 나의 목적에 따라 시각화 툴의 기능을 선택해 원하는 형태의 시각화를 만들 수 있어야 하기 때문인데요! 따라서, 시각화 제작에 관심이 있다면 튜토리얼 학습에 많은 시간을 들이기보다는 실제 내가 관심 있는 데이터로 다양한 시각화 차트를 만들고 무엇이 더 나은지 판단해 보는 과정을 반복해 보시기를 추천합니다.
어느 분야에서나 성장을 더디게 만드는 방해 요인이 존재하기 마련입니다. 데이터 시각화 분야가 지금보다 더 성장하기 위해서 미리 고민하고, 해결해야 할 문제는 어떤 것이 있을까요?
위 시각화는 비주얼라이저가 꼽은 데이터 시각화 분야가 직면한 가장 중요한 문제점을 막대 차트로 나타낸 것인데요. 각 막대는 문제점들을 의미하고, 막대의 높이는 해당 문제를 고른 응답자의 수를 의미합니다. 왼쪽부터 ‘데이터 리터러시의 부족 (Lack of visualization literacy)’, ‘데이터 시각화의 중요성 인지 부족 (Lack of awareness of the impact of data viz)’ 항목이 가장 많이 선택된 것을 확인할 수 있습니다. 뉴스젤리 역시 경험적으로 최근 몇 년 사이 국내의 경우 ‘시각화’ 자체에 대한 관심과 인식이 늘어났다고 느끼고 있지만, 여전히 시각화를 단순한 차트 몇 가지나 그림 정도로 인식하고 있는 경우도 종종 발견할 수 있었어요. 설문 결과를 통해 ‘데이터 시각화 중요성 인지’를 위해 더욱 노력해야겠다는 다짐을 다시 한 번 하게 되네요.
또한 이 막대 차트에서는 진한 색 막대를 더해 추가적인 정보를 제공하고 있는데요! 문제점 중에서 우선적으로 해결해야 한다고 생각하는 것을 고르는 설문의 결과가 나타나 있어요. 퍼센트 수치가 높을수록 긴급해야 해결해야 할 문제임을 뜻합니다. 많은 문제점 중에서도 ‘기술의 다양성 (Diversity in tech)’, ‘알고리즘 편향 (Algorithmic bias)’, ‘데이터 시각화에 대한 윤리적 기준 부족 (Lack of ethical standards for visualizing data)’ 등의 문제가 선택된 것을 확인할 수 있는데요. 데이터 시각화 업계에 종사하고 있는 많은 사람들의 적극적인 시도가 필요함과 동시에 윤리적 이슈에 대한 고민을 꾸준히 해나가야 할 것 같습니다.
지금까지 데이터 시각화 종사자들은 어떤 분야에서, 어떤 직업을 가지고 일하는지부터 데이터 시각화 작업 중 어떤 어려움을 겪는지, 데이터 시각화를 위해서는 무엇을 어떻게 배워야 하고 데이터 시각화 분야가 직면한 문제는 어떤 것이 있는지까지 자세히 알아보았습니다. 2022년 데이터 시각화 종사자 대상 설문조사 결과로, 현장의 목소리를 들을 수 있었는데요! 데이터 시각화 분야를 이해하는 데 도움이 되셨을까요?
에디터는 다양한 설문조사 결과 중에서도 비주얼라이저들도 언급한 문제인 ‘데이터 리터러시의 부족’ 문제가 가장 인상 깊었습니다. 데이터 활용의 중요성이 점점 강조되고 있는 시대인데도 불구하고, 데이터 리터러시가 부족하다면 아무리 데이터가 많은 정보를 담고 있어도 해석할 수가 없기 때문이에요. 그런 의미에서 보다 많은 분들이 데이터를 활용하는 가장 쉬운 방법인 데이터 시각화를 통해 데이터 리터러시의 경험을 늘려 가셨으면 좋겠어요.
아마 이 글을 보시는 분들은 대부분 데이터 시각화를 일로서 하시기보다는 간단한 데이터 시각화 차트를 만들거나, 만들어진 시각화 차트를 해석하고 계실 텐데요. 설문조사 결과에서도 알 수 있었다시피, 데이터 시각화 스킬을 배우는 데에는 예제 분석과 실습이 가장 도움이 된다고 합니다. 뉴스젤리의 데이터 스토리텔링 콘텐츠를 통해서 많은 예제를 접하며 데이터 리터러시에 대한 이해를 높여 보시는 건 어떨까요? 이번 콘텐츠와 함께 뉴스젤리가 발행하는 콘텐츠 또한 여러분의 데이터 시각화 길잡이가 되어 줄 수 있기를 바라 봅니다.
[자료 출처]
- DVS, Data Visualization State of the Industry Survey, 2022