brunch

You can make anything
by writing

C.S.Lewis

by 한봄소리 Dec 11. 2020

숫자는 거짓말을 한다

통계와 그래프에 속지 않는 데이터 읽기의 힘

<미디어 리터러시>에 대한 책이나 연구는 많아도 <데이터 리터러시>에 대한 책은 잘 찾기 어려웠던 점이 아쉬웠는데, <데이터 리터러시>에 대한 궁금한 점을 잘 해소해주는 좋은 책이 출간되어 리뷰로 소개한다. 알베르토 카이로의 <숫자는 거짓말을 한다>이다.


http://www.yes24.com/Product/Goods/93738321?OzSrank=1


이 책의 원제는 <How Charts Lie>이다. 데이터 시각화의 세계적 권위자인 알베르토 카이로의 신간이다. 카이로 형님이라고 부르며 팬임을 자처하는데, 그분이 썼던 책 <진실을 드러내는 데이터 시각화의 과학과 예술>을 읽으면서 저자의 내공을 느끼며 이 분 책은 꼭 다 봐야겠다는 다짐을 했었다. 학술적 연구, 실무적 예시, 철학적 고찰을 책 안에서 골고루 느낄 수 있었다. 이번 책은 원서가 출간되자마자 꽤 번역본이 빨리 나왔다. 책 말미에 코로나 언급이 실려있을 정도니까.


<숫자는 거짓말을 한다>는 '차트'라고 불리는 데이터 시각화를 '읽는 방법'에 더 포커싱 해서 서술하고 있다. 차트를 '제대로 읽기'의 중요성은 데이터 시각화를 만드는 디자이너의 역할뿐만 아니라 일반인, 학생에게까지도 반드시 교육이 필요라는 생각이 든다. 정보의 홍수의 시대를 사는 우리에게 시각화 데이터를 제대로 읽는 도해력(graphicacy) 은 책을 읽는 생활에 꼭 필요한 지식이지 않은가. 저자는 성인이라면 문해력과 구어력뿐만 아니라 산술력과 도해력을 갖춰야 한다고 말한다.


#1. 요약


전체 내용에 대해  바르게 차트를 읽는 팁을 중심으로 요약해본다.


차트를 해석하는 5단계 법칙


아래 차트를 순서대로 찬찬히 해석해보자 :)


p.58

1. 제목 설명 출처
   차트에 제목과 설명이 있다면 그것부터 읽자. 출처가 명시되어 있다면 역시 살펴본다.
2. 측정 대상, 단위, 척도, 범례 
   차트는 무엇을 어떻게 측정했는지에 관한 정보를 문자 도는 시각 자료로 표시해야 한다.
    x축 :  2016년 미국의 대선 결과와 보궐선거 결과의 격차
    y축 : 2017년 1월 20일 트럼프 대통령의 취임식 이후 지난 날짜
   색깔이 표시된 범례는 각 원이 보궐선거에서 이긴 후보를 의미함을 알려줌
3. 시각적 부호화
   부호화 방법 : 회색 원은 민주당 후보, 붉은색 원은 공화당 후보가 승리했다는 의미
   원의 명도 : 양당이 기존 의석을 사수했는지 탈환했는지

   위치 :  수직축 위의 위치는 2016년 대선 결과와의 % 차이
4. 주석을 읽어라
   차트 제작자들은 핵심이나 요점을 강조하기 위해 짧은 설명을 곁들이기도 한다.
    이 차트에서는 켄터키주 제49번 지역 선거구를 강조함
5. 폭넓은 시야로 패턴과 동향, 관계를 파악하라
   차트를 전체적으로 볼 땐 군집을 주목하자
    (ex. 2017년 1월 20일 이후 민주당은 공화당보다 많은 의석을 탈환했다)



다음과 같은 경우 차트는 거짓말을 할 수 있다

디자인이 잘못되었을 때

잘못된 데이터를 사용할 때

표시된 데이터의 양이 너무 많거나 적을 때

불확실성을 숨기거나 헷갈리게 할 때

잘못된 패턴을 제시할 때

사람들의 기대나 편견에 영합할 때


차트를 읽는 데 유용한 요령   

'어떤'데이터를 '어떻게' 집계했는지 검토하라. (정보의 정확성 검증)

숫자는 여러 가지로 해석할 수 있기 때문에 다양한 각도에서 접근해야 한다

차트만으로는 아무것도 증명할 수 없다

연관성을 인과관계로 추측해서는 안된다

차트에 표시된 데이터 뒤에 다른 패턴이나 추세가 숨어 있는 건 아닐까?  

이 차트에 나타난 패턴 또는 추세가 그 자체만으로 차트 작성자의 주장을 뒷받침하는데 충분한가?

통계에서 오차는 오류가 아니라 불확실성의 동의어다

백분율은 필요한 것보다 더 숫자를 관념적으로 만든다


취임 이후 트럼프 대통령이 트위터에서 비난한 대상 p.68


차트를 만들고 읽을 때 가장 중요한 원칙

차트는 신뢰할 수 있는 데이터를 기반으로 할 때에만 신뢰할 수 있다

차트는 시각적 논거가 될 수 있으나 차트만으로는 충분하지 않다

데이터와 차트가 사람들의 생명을 구하고 마음을 바꾸게 할 수 있다


모든 차트는 현실의 단순화된 표현이며, 복잡한 현실을 숨기는 만큼 또한 많은 것을 드러낸다.

차트는 호기심을 자극하고 데이터에 관해 더 나은 질문을 하게 만드는 효과적인 방법이다.

좋은 차트는 우리가 더 나은 결정을 하게 돕는다.

차트의 성공 여부는 그것을 디자인한 사람은 물론 읽는 사람에게 달려 있다.


#2. 리뷰


COOL

차트 속에서 진실을, 나아가 세상을 바로 읽어내는 방법을 알 수 있다

미국 대선, 코로나 등 흥미진진한 예제 차트를 많이 접할 수 있다

수치적 표현뿐만 아니라 인간의 심리에 따른 편향을 다루고 있다

데이터 리터러시 (도해력) 향상을 위해 많은 이들이 보았으면 하는 바람이다


실용성 상

레퍼런스 상

재미 상

전문성 중

난이도 하



하기는 저자의 홈페이지다. 더 많은 정보를 참고하고 싶다면 고고~

http://albertocairo.com/



















브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari