brunch

You can make anything
by writing

C.S.Lewis

by SSEN Mar 11. 2024

숫자라고 다 믿을 수는 없는 이유

「데이터는 거짓말을 한다」 후기

숫자라고 완벽한 게 아니다

데이터와 그래프를 들이밀면 모두 똑똑한 답을 내는 거라고 생각하는 경향이 있습니다. 길이가 긴 글이나 영상 컨텐츠에 대한 집중도가 떨어지는 와중에 단편으로 된 그래프나 숫자들이 모든 답이 될 것이라고 생각하는 거죠. 그러나 철석같이 믿었던 데이터나 그래프도 정작 마음을 먹으면 얼마든지 다른 이야기를 할 수 있다는 것을 생각해야 합니다. 그런 면에서 이번 책인 '숫자는 거짓말을 한다'는 데이터를 보고 판단해야 할 독자가 그래프가 어떻게 거짓말을 할 수 있는지 다른 가능성들을 찾아볼 수 있는 생각거리를 던져주는 책이었습니다.

저자인 알베르토 카이로는 관련 도서나 활동으로는 현재 데이터 시각화 분야에서 거의 탑에 드는 연구자라고 볼 수 있습니다. 개인적으로 이 분의 의견 표현 방식을 좋아하는 이유는 항상 '나도 틀릴 수 있다'는 가능성을 가지고 있기 때문인데요. 주관적으로 볼 수밖에 없는 데이터 시각화 작업물도 '어떻게 하면 데이터를 잘 전달할 수 있는가'라는 목표에 맞춰서 여러 의견들을 폭넓게 받아들여 더 나은 결과물을 만들 수 있도록 지원한다는 점에서 꾸준히 트래킹 할 만한 분이라고 생각합니다.(개인적으로 링크드인 팔로우도 걸어두고 있습니다. 최근에도 새로운 책이 추가되었군요. 저자_알베르토 카이로_링크드인)


이 책이 나온 시점은 원서 기준으로 미국에서 트럼프가 대통령 당선에 성공한 직후입니다. 그러다 보니 트럼트 대통령 당선 당시에 사용되었던 그래프들이 어떻게 미국인들의 오해를 불러일으킬 수 있는지를 볼 수 있습니다. 올해 한국에서 열릴 총선 대비해서도 여러 가지 그래프들이 나올 텐데 이 책을 보면서도 왠지 대비해야겠다는 생각이 들더군요.


개인적으로 이 책을 통해 가장 도움을 얻은 컨텐츠는 아래의 나이팅게일이 제작했다고 알려진 로즈 다이어그램에 대한 것이었습니다. 제 데이터 시각화 수업에서도 시작하는 부분에서 중요하게 다뤘던 그래프인데 저도 정확히 파악하지 못한 내용이 있더군요. 책의 내용과 몇 가지를 덧붙여서 강의에서도 수정할 계획이지만 굵직한 사항은 이곳에도 정리합니다.

1. 오른쪽의 원형의 그래프는 1854년 4월부터 1855년 3월, 왼쪽의 그래프는 1855년 4월부터 1856년 3월 기간을 보여줍니다. 

2. 1855년 3월에 나이팅게일이 후원한 위생위원회가 활동을 시작합니다. 위원회는 하수관 청소, 환기시설 개선, 쓰레기를 체계적으로 처분하도록 지시합니다.

3. 이 그래프는 나이팅게일이 런던으로 돌아와(나이팅게일이 활약한 야전병원은 크림전쟁 시 지금의 튀르키예에 있었습니다.) 위생위원회의 성과를 분석한 후 얻은 결과물로 만든 것입니다.

4. 위생위원회와 함께 연구와 참여한 이들 중에는 의료위생 전문 통계학자 윌리엄 파(William Farr)도 있었습니다. 사망률이 급격이 줄어든 원인을 단순히 병원의 위생 상태 개선만으로 설명할 수는 없지만 나이팅게일은 그것을 중요한 요인으로 봤고요.

5. 나이팅게일은 위생 및 환기 시스템을 개선했다면 더 많은 환자를 살릴 수 있었을 거라는 자책 때문에 1910년에 세상을 뜰 때까지 평생을 간호학 및 공중 보건 실천에 바칩니다.

6. 저자(알베르토 카이로)의 개인적 추측으로는, 나이팅게일이 단순히 사실과 정보를 전달하는 것이 아니라 눈길을 사로잡는 그래픽으로 상대방을 설득하려 했다고 생각합니다. 

7. 차트를 만들고 읽을 때 가장 중요한 원칙은 다음과 같습니다.

 - 차트는 신뢰할 수 있는 데이터를 기반으로 할 때에만 신뢰할 수 있다.

 - 차트는 시각적 논거가 될 수 있으나 차트만으로는 충분하지 않다.
(숫자 없이는 세상을 이해할 수 없다. 그리고 숫자만으로는 세상을 이해할 수도 없다. by. 한스 로슬링)

 - 데이터와 차트는 사람의 생명을 구하고 마음을 바꾸게 할 수 있다.


더 나아가기

이 책을 읽으면서 더욱더 데이터 시각화에 집중해 봐야겠다고 생각한 이유는, 단순히 기술로서의 데이터 시각화를 설명하는 게 아니라 일종의 책임감으로 이 분야를 설명하고 있기 때문이었습니다. 데이터 시각화는 어쨌든 일반인들이 한 번에 이해하기에 쉽지 않은 컨텐츠라는 걸 인정해야 다른 사람들이 이해할 수 있는 자료를 만들 수 있습니다. 


또한 데이터 너머의 사람을 봐야 한다는 책의 끝 부분도 마음에 새겨야 할 부분이었습니다. 코로나로 인해 사라진 24만 6027명을 설명하면서, 이들을 단순히 숫자나 차트의 작은 점으로 기억해서는 안된다는 멘트에서 데이터 시각화를 대하는 태도를 다잡아야 할 필요를 느꼈습니다.




 주위에 팀장급이라고 할만한 레퍼런스가 없다면?
 레퍼런스 찾기에도 지친 여러분들을 위해 뉴스레터를 준비했습니다.


팀장님의 피드백이 필요한 분들은 아래의 링크를 통해 뉴스레터를 신청해 주세요. 실무에 적절한 피드백과 적절한 기능, 소스 등을 알려드리겠습니다.


그럼 저는 다음에도 더 도움 되는 자료로 돌아오겠습니다.


멈추지 말고 문서를 그리세요.


감사합니다.




Copyright 2024.(KIM SENA) All pictures cannot be copied without permission



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari