데이터로 전문가처럼 말하기
우선 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평임을 밝힙니다.
인간은 근본적으로 더 깊이 파고드는 성향을 가진 기적 생명체이다.
우리의 역할은 그 본능을 자극하고, 더 깊이 있는 탐구를 가능하게 돕는 것이다.
21%의 직원만이 데이터를 읽고 이해하고 작업할 수 있다. '데이터 전문가처럼 말하기'는 79%의 사람을 위하여 만들어졌다. 거시적 관점에서 기초적 데이터 작업 능력을 배양하고 언제, 어떻게, 어디에 데이터를 사용할 지에 대한 가이드를 제공한다.
▶︎ '데이터로 전문가처럼 말하기'의 특징은?
- 데이터, 커뮤니케이션 등 단어 사용 빈도는 높지만 깊게 정의해보지 않았던 개념을 되짚어보기
- 데이터를 명확하고 효과적으로 사용하는 법을 안내
- 데이터 가공 전 ~ 데이터로 완성한 자료를 가지고 커뮤니케이션하는 전체 과정에 대한 이해
▶︎ 어떤 대상이 '데이터로 전문가처럼 말하기'를 읽으면 효과적일까?
- 커뮤니케이션과 데이터의 정의, 데이터 분석가로서 가져야 할 자세가 궁금한 사람
- 데이터 시각화 요소의 전반을 이해하고 올바르게 사용하고 싶은 사람
- 실무에서 데이터 커뮤니케이션의 활용 방식이 궁금한 사람
최근 데이터를 만지는 빈도가 늘어나 개인적으로 이 책을 읽어보고 싶었는데 마침 서평 대상 도서가 되었다 :D 책을 읽으면서 숙고하지 않고 진행했던 데이터 작업들이 많았다는 걸 인지했고 책에서 데이터 작업에 필요한 기초적인 모든 것을 다뤄준 덕분에 내가 놓쳤던 부분을 되짚어 볼 수 있게 됐다.
우리는 왜 데이터를 사용하는 걸까?
- 데이터란 관찰 대상을 더 잘 이해하기 위한 목적으로 수집된 자료
- 디지털화로 인해 다양한 데이터를 측정하고 저장할 수 있게 됨
- 데이터 속 의미를 파악하고 이를 이용하여 더 나은 서비스를 창출하는데 집중
올바른 데이터 구조를 만들기 위해서는?
- 데이터 구성 요소와 데이터 출처, 저장 방법 고려
- 데이터 작업 시 고려해야 할 이해관계자의 필요를 인식: 요구사항(데이터로 해결해야 하는 질문과 과제)에 대한 올바른 데이터 확보뿐 아니라 결괏값으로 보여줄 차트, 레이아웃 등 형식에 대해서도 고려해야 함
저자는 데이터를 이용해 다른 사람을 설득하는 것은 쉬운 일이 아니며, 데이터 사용자와 이해관계자의 요구 사항은 모두 다르다고 이야기한다. 우리가 할 수 있는 최선은 기본적인 구성요소에 대한 이해를 높여 보다 확실한 데이터 분석 기술을 익히는 것을 강조한다.
3장에서는 표, 막대 차트, 꺾은선 차트와 같은 가장 기본적인 형태를 설명한다.
표: 열과 행으로 구성된 정렬 양식, 단순한 구조를 통해 값을 쉽게 발견
막대 차트: 길이와 높이를 이용하여 데이터의 패턴을 빠르게 파악하기 유리
꺾은선 차트: 데이터의 추세를 확인하는 데 유용
4장에서는 몇 가지 다른 유형의 차트와 한 차트에 두 가지 값을 사용하는 법을 알려준다.
산점도: 대량의 데이터를 한 페이지에 맞게 추려 표시할 때 손실 방지
지도: 청중의 관심을 끌고, 전달하고자 하는 메시지를 쉽게 표현
전체 분할 차트: 세부 데이터를 분할하여 전체 데이터에 대한 설명을 도움
(5장) 데이터 기반 커뮤니케이션에 차트가 효과적인 요소지만, 차트 선택에만 너무 집중할 경우 데이터 시각화 요소의 다른 요인을 잘 고려하지 못할 수 있다. 데이터 시각화에 색상, 크기, 형태와 같은 사전주의(pre-attentive attributes)속성을 효과적으로 사용하면 보다 명확한 메시지 전달과 시각화 심미성을 향상할 수 있다. 여기부터 약간 디자인 감각이 필요한 것 같기도
(6장) 데이터 사용자가 차트와 같이 시각화 자료를 이해하려 할 때, 가장 핵심은 데이터를 둘러싼 맥락이다. 데이터 기반 커뮤니케이션에서 맥락이란 분석이 수행되는 상황, 분석 기반으로 하는 기준, 이를 둘러싼 모든 요인을 말한다. 전달받은 맥락에 따라 청중이 데이터 정보를 머릿속에 정리, 배치, 이해한다.
(맥락을 구성하는 것: 제목, 텍스트와 주석, 맥락 관련 숫자, 범례, 도해와 시각적 단서, 배경과 배치)
우리가 데이터 분석에 이용하는 모든 구성 요소는 전달하고자 하는 메시지를 명확히 하고, 청중의 이해를 도울 수 있어야 하며, 의도한 방식대로 해석을 이끌어야 한다.
(7장) 복잡한 데이터 분석 내용을 하나의 차트에 짜 넣는 것은 청중을 혼란스럽게 만들고, 핵심 내용을 흐리며, 분명하지 못한 메시지 전달을 야기한다. 이 문제에 대한 해결책은 결과를 각각 표현한 여러 개의 차트를 사용하는 것이다.
설명적 커뮤니케이션: 청중에게 우리의 분석 결과를 명확히 표현
탐구적 커뮤니케이션: 청중이 데이터 시각화를 직접 탐구 / 데이터를 상세히 보기 위한 옵션 이용 가능
대시보드: 어떤 상태를 추적, 관찰하거나, 이해를 돕기 위해 사용되는 시각적 표시
인포그래픽: 데이터 주제에 경험이 없는 사람들과 정보 공유하기 위해 사용
슬라이드 프레젠테이션: 대면 시 메시지 전달에 효과적
이메일
실무에서 데이터 시각화를 할 때, 완벽한 방도는 없다. 이해관계자의 요구사항, 분석 스타일, 주제에 대한 지식수준을 바탕으로 언제든지 변경, 조정이 있을 수 있다. 그러므로 완벽함보다는 균형에 더 초점을 맞춰야 한다.
무엇을 사용할 것인가?
표 vs 시각화 자료
정적 vs 대화형
중앙 집중형 vs 분산형 데이터팀
실시간 데이터 vs 비실시간 데이터
표준화 보고서 양식 vs 혁신적 보고서 양식
보고 vs 분석
줄타기를 잘해야 한다
데이터를 통해 문제 해결을 할 때 단일 공식은 존재하지 않는다.
조직 내 여러 사람과의 논의를 통해, 대응되는 요인들 사이에 균형을 찾아,
가장 적절한 타협점에 이를 수 있도록 노력해야 한다.
사실 데이터뿐 아니라 협업 시 모든 상황에 해당되는 말.
책을 덮고 나서 그동안의 데이터 작업은 본능적인 감각에 기대 만들어 왔던 게 아닌가 하는 약간의 반성과 함께 데이터 결과물이 주는 의의를 복기하게 된 시간. 평소에 (습관성) 데이터 자료를 만드는 사람이라면 이 책을 읽었을 때 만족스러울 것 같다.