#2 2017 정보시각화 워크숍 Malofiej25 참관기
지난 글에 이어서 이번에는 정말 나에게 뼈와 살이 되었던 워크숍 경험을 공유합니다. 'Show Don't Tell'은 워크숍의 이름이다. 정보시각화를 하는 이들에게 너무 당연하고 기본이 되는 말이다. 주저리주저리 설명할 필요가 뭐가 있겠는가. 좋은 시각화는 굳이 설명해도 이해되어야 하는 것을.
3개의 워크숍 주제 중 'Interactive Storytelling' 과정을 신청했는데, 디자이너라면 다른 워크숍을 흥미로워하실지도 모르겠다(이 과정은 데이터를 다루니깐). 우리 선생님은 'The Guardian Visuals' 그래픽 에디터 Xaquín Veira González (이하 샤퀸)가 진행해줬다. 팀 프로젝트 성격으로 진행됐고, 트럼프의 팩트체크 데이터를 활용해서 시각화가 포함된 데이터 저널리즘 기사를 완성시키는 게 워크숍의 목표였다. 그런데..!! 디자이너들은 전부 다른 워크숍에 참가해서 그런지 우리 워크숍엔 데이터 저널리스트 3명, 개발자 1명, 통계학 박사 1명 그리고 나 이렇게 구성됐는데, 일러스트레이터의 ai2html을 사용할 수 있다는 이유만으로 디자이너의 역할을 수행했다. 인터랙티브 스토리텔링 시간이었지만 오늘날 흐름에 맞게 디바이스에 맞는 시각화를 구현하기로 우린 기획했다. [참고글]
<워크숍의 시작>
미리 워크숍을 신청했기 때문에 스페인으로 가기 전에 Data Wrangling 부분은 예열(?!)을 하고 갔다. 주최 측에서는 한국인으로는 처음 워크숍에 참가하는 거 같다고 하는 말에 절대 망신당하고 싶진 않았다. 하지만 이게 웬걸. 서로 소개를 하자마자 샤퀸은 노트북을 전부 덮어라고 한다. 그리고 좋은 시각화의 핵심은 디자인 이전의 과정임을 강조한다. "좋은 스토리에서 좋은 시각화가 나오는 거야. 디자이너 역시 스토리를 뽑아내는 과정에 참여하고 데이터를 다룰 수 있어야 해" 일주일 동안 Malofiej에서 귀가 아프도록 들은 말의 시작이었다. 'Story' 시각화 워크숍에서 'Visualization'이란 단어보다 'Story'란 단어가 많이 쓰인 이유는 워크숍 말미에 더 구체적으로 느꼈던 거 같다. 그리고 스토리를 만들고 데이터를 뒷받침하지 않았다. 데이터 속에서 스토리를 구체화시켜야 하는 전제는 내가 해오던 프로세스와는 반대였는데 이거 역시 말미에 다시 이야기하도록 해본다.
결국에는 디자이너의 데이터 리터러시(Data Literacy)의 문제다. 데이터에서 좋은 스토리를 이끌어내기 위해서 기자, 디자이너, 개발자가 함께 데이터를 보며 논의하고 과정을 수행해야 하는데 데이터를 볼 수 없다면 소외될 수밖에 없다. 그런 의견도 나왔다. 자신이 디자인하는 재료인 데이터에 대한 이해 없이 어떻게 디자인을 구현하겠냐고. 의미를 알지 못하고 수행하는 디자인이 무슨 의미가 있겠는지에 대한 의견은 좋은 지적이었다.
이러한 맥락으로, 우리 팀에는 디자이너가 없어서 점심시간에 Bloomberg Visual팀의 친구에게 물어보니 기본적으로 데이터를 다루는 능력은 어느 정도 갖추고 있다고 했다. http://learno.net/ 에서 기본적인 데이터에 대한 이론과 실습을 배워보는 걸 추천한다.
기본적으로 디자이너가 갖추어야 하는 데이터 리터러시는 전문가의 수준은 아니다. 2017년 1학기 홍대국제대학원(IDAS)에서 203 Infographics Lab 장성환 대표님과 디자이너 대상으로 한 학기 강의를 진행하고 있는데 데이터의 이해, Google Spreadsheet를 활용한 정량적 데이터/정성적 데이터의 관리, 분류화 및 구조화 작업 그리고 최종적으로 정리된 데이터를 R에서 시각화까지 일련의 과정들을 재밌게 진행하고 있다. 겁먹지 말고 도전해봤으면 좋겠다.
(왼쪽은 정량적 데이터 실습을 위한 구글 스프레드시트 활용 오른쪽은 데이터 분류 작업)
<데이터와 카드>
샤퀸은 준비해온 카드 50장을 우리에게 줬다. 카드 한 장에는 트럼프의 팩트체크 관련 변수(POLITIFACT의 PANTS ON FIRE)들이 레이아웃 되어 있었고 카드의 색은 TRUE/FALSE의 5단계로 구별되었다. 그리고 샤퀸은 강의실을 나갔다! 그렇게 우리는 우리만의 스토리를 뽑아내기 위해 카드를 집어 들었고 분류화를 시작했다.
바로 해볼 수 있는 건 진실과 거짓 단계별 카드의 분류부터였다. 할 수 있는 분류화를 다해 보면서 부족한 데이터와 정보는 별도로 찾아서 뒷받침했다. 그 과정에서 필요한 크롤링을 할 때에는 노트북을 활용했다. 즉, 툴의 도움을 빌렸다. 암튼 첫날엔 하루 종일 분류화하고 통계내고 DBg화 시켰다. 그렇게 스토리 도출만 하다 해가 졌다.
그 과정은 길었지만 재밌는 스토리도 꽤 나왔다. 예를 들어 트럼프가 언제 트위터에 거짓말을 많이 했는지 포스팅 시간 데이터를 보면 이상하게 새벽에 많이 거짓말을 했고 국가 안보 주제보다는 경제 관련 주제의 거짓말이 많이 나왔다. 샤퀸에게 근데 너 이런 도출된 이야기들은 이미 가디언에서 기사로 쓴 거 아냐?라고 물어봤더니 아니! 나도 처음 알았어. 내가 이걸로 기사를 쓰고 싶네 라고 하는데 진짜인가 싶었다.
<데이터와 협업 툴>
(왼쪽은 구글 문서에서 기사 작성, 가운데는 작성된 텍스트가 json으로 변환된 모습, 오른쪽은 구글시트에서 데이터 공동 작업)
샤퀸은 툴을 쓰지 말라고 했지만 잠깐 툴을 소개하고 설치하는 시간도 가졌다. 우린 총 5가지의 툴을 썼다. Google Spreadsheet, Google Docs, Slack, Github, NPM인데 Google Spreadsheet는 raw data를 모두에게 공유한 뒤에 각자 master sheet를 복사해가서 분석하는 용도로 썼다. 공동 작업이 가능하기 때문에 서로 어디까지 진행했고 어떤 스토리가 나오는지 실시간으로 보기 용이했다. Google Docs는 기사 작성을 위해서 썼는데 꽤 흥미로웠다. Google Docs에서 쓴 plain text(특정 문법 구조 바탕으로 작성)가 전부 json으로 변환되어 실시간 html에 반영되는 이 은혜로운 과정을 지켜보며 감탄했다. 왜냐면 기자가 텍스트 수정하고 개발자에게 수정 혹은 반영해달라고 할 필요가 전혀 없는 프로세스였고 여러 명의 저널리스트가 파트별로 기사 작성을 해도 실시간 반영되는 굉장히 효율적인 과정이다. Slack은 효과적인 커뮤니케이션을 목적으로 Github과 NPM은 인터랙티브 웹 기사 개발을 위해 썼다. 너무 구체적으로 설명하긴 깊게 들어가야 해서 이건 여기까지 설명하고 넘어가겠음.
<첫날의 마무리>
첫날이 마무리가 됐을까? 아니다. 각자 집에 가서 해야 할 to do list를 정했다. 마지막 날 기사 작성한 걸 발표해야 했기 때문에 시간을 맞추려면 숙소로 돌아가서 더 해야 할 수밖에 없었다. 시차 적응에 각자 다른 영어 억양 그리고 하루 종일 데이터 때문에 팜플로나에서의 첫날은 맥주로 달랬다.
하지만 배운 게 많은 하루였기도 했다. 기술적인걸 배웠다는 게 아니라 데이터를 바라보는 시각과 마음가짐 그리고 협업의 프로세스에서 값진 하루를 건졌다. 한편으론 그런 생각도 들었다. 여긴 해외 미디어들에서 일하는 사람들이고 이 프로세스가 우리나라에 적용될 수 있을까?
그건 장담할 수 없겠다. 변화의 출발은 데이터와 그 일을 하는 사람들을 대하는 태도와 문화이지 않을까.
- Google Spreadsheet : https://www.google.com/intl/ko_kr/sheets/about/
- Google Docs : https://www.google.com/intl/en-GB/docs/about/
- Slack : https://slack.com
- Github : https://github.com