brunch

You can make anything
by writing

C.S.Lewis

by Sue Jun 05. 2022

데이터보다 목적이 더 중요한거야!

<데이터 문해력>을 읽고 

책을 읽게 된 배경 


데이터 문해력, 가시와기 요시키 지음


데이터의 중요성이 부각되고 있는 시대이다. 너도나도 데이터를 공부해야 한다고 외치고 있는 이 시점에서, 디자이너로서 나는 어떤 포지션을 취해야 할지 고민이 많이 되었던 것 같다. 

'데이터 기반 디자인'을 해야 앞으로 살아남을 수 있다는 이야기는 많이 듣는다.. 그런데 이 점에 대해서 나는 어떻게 해야할까? 그래서 나보고 어쩌라는 거지? 라는 질문도 마음 속으로 수도 없이 했다. 

그 와중에 이 책을 추천받게 되었고, 내면의 질문들을 해소할 수 있었다. 

이 책을 읽고 나서 어떤 식으로 데이터에 접근해야 할지 인사이트를 얻을 수 있었다. 

많은 분들이 각자의 본업에서 중요시 하는 관점들이 있을 수 있다. 어떠한 관점이든, 이 책은 공통적으로 무엇이 중요한지를 짚어주는 차원에서 매우 좋은 역할을 한다고 생각한다. 



책 내용에 대한 소개 및 발췌  


데이터를 볼 때 주의해야 할 점, 그리고 접근법

저자는 데이터를 바로 '분석'하거나 데이터에서 바로 결과를 해석하는 데에만 급급해서는 안된다고 지적한다. 우리가 데이터를 사용하는 이유는 문제를 해결하는데 필요한 근거 자료를 마련하기 위함이고 어떻게 문제를 해결했는지 논리적인 사고 전개를 하기 위함이기 때문이다. 

따라서 모든 챕터에서 저자가 역설하고 있는 점은 바로 데이터를 보는 '목적'의 중요성이고, 어떤 현상에 대한 '원인'의 고찰이다. 


책 내용에 대한 발췌 

이 책의 4장, 5장에서 다루고 있는 내용이 인상깊어서 그 부분만을 우선적으로 발췌해 보고자 한다. 


4장. 결과가 나왔다고 끝난 것은 아니다


4.3. 알아두어야 할 주의사항

1) 직접적인 관계인지, 간접적인 관계인지?

이 부분은 요인 간의 상관분석을 설명하면서 곁가지로 소개한 내용이다. 데이터상 관련성이 있는 것처럼 보여도 실제로는 두 데이터 사이에 직접적인 관련성이 없는 경우가 은근히 많다고 한다. 

'데이터를 뒤져보면 그 안에 반드시 답이 있을 것이다. 그것을 찾아내자'라는 식의 발상은 일단 리셋하고, 데이터를 보기 전에 가능성이 있는지를 먼저 생각해봐야 한다. 


2) 원인은 한 가지가 아니라 여럿이거나 복잡할수도 있다.

위험을 회피하기 위해서는 모든 가능성을 염두에 두고 사고를 확장해 원인을 고려하는 것이 데이터 문해력의 기본이다. 


3) 상관관계는 인과관계를 나타내는 것이 아니다. 

상관관계가 있다(높다)는 것은 두 데이터 사이의 관계가 '선형'이라는 말과 같다. 선형 관계성 여부만 파악하는 것은 주의해야 한다. '상관관계가 있다'라는 결과가 분석을 통해 도출되지만, 양자 간 '인과관계'가 있는지 어떤지, 그리고 어느 쪽이 결과이고 어느 쪽이 원인인지는 분석자의 '해석'에 달려있다. 


5장. 기법에 집착하지 마라 


5.1. 자꾸만 늘어가는 '방법맨'이란 

1) 데이터를 활용하려면 본질적으로 논리적인 사고가 반드시 기반이 되어야 한다. 

논리적 사고란, 개별 데이터와 분석에 대한 것이 아니라, 전체적인 스토리를 탄탄히 구성하고 결론의 설득력을 높이기 위한 사고력과 구성력을 말한다. 이를 제대로 갖추지 않으면 아무리 고품질의 데이터를 다량으로 수집하고 완벽한 방법론으로 분석했다 해도, 상대방을 설득하기는 어려울 것이다. 설득이 어려운 이유는 전체적으로 흐름과 논리성에 맞지 않기 때문이다. 


2) 문제 해결 프로세스에서 누구나 하는 실수 -> "곧바로 해결 방안에 무턱대고 달려드는 것"

데이터를 확인하고 그것에 대한 철저한 원인 분석 없이 해결책 아이디어부터 내려는 사람을 필자는 "방법맨"이라고 부르고 있다. 그런데 이렇게 '참신한 아이디어만 내면 된다'는 생각이라면 애당초 데이터는 필요가 없다. 


5.3. 왜 원인이 그런지 끈질기게 생각하라 

"방법맨"이 되는 것을 피하려면 일단 '문제',' 원인', '해결 방안'이라는 가장 단순한 프로세스를 항상 염두에 두고, 자신이 생각하고 있는 것이 세 가지 중 어느 쪽에 해당하는지 파악해야 한다.


1) 원인의 구조를 단순하게만 볼 수 없다. 

원인 후보를 추출했다고 서둘러 다음 단계로 넘어가면 안된다. 원인은 항상 단순한 구조가 아니기 때문이다. 가급적 '어째서', '왜'를 반복해서 더욱 본질적인 원인까지 파고들어야 정확하고 밀도 있는 해결 방안을 도출할 수 있다. 


2) 얼마나 '왜'를 반복하면 될까?

실제로 하다보면 가장 고민되는 문제일 것이다. 그런데 필자에 따르면 원칙은 "해결 방안을 고민하는 것은 가장 마지막 단계"라고 한다. 이 점에서 미루어 보았을 때, '왜'는 가장 근본적인 이유를 찾아내기 전까지 깊이있게 치열하게 해야 하는 것 같다. 정해진 횟수는 없고 문제마다 상대적이겠지만 말이다. 왜냐하면 왜를 충분히 하지 않았을 때 우리가 내게 되는 결론은 결국 즉흥적으로 만든 대책이 되어버리고, 이러한 대책은 그 효과와 정확성이 결여될 것이기 때문이다. 


느낀 점, Lesson learned  

이 책을 읽으면서 데이터 그 자체는 문제 해결을 위해서 큰 힘을 가질 수 없다는 점을 가장 크게 깨달은 것 같다. 시중에는 훌륭한 강사들의 좋은 데이터 분석 강의들이 매우 많이 나와있는 것을 느낀다. 내 주변에서도 대부분이 데이터를 어떻게 분석할지, SQL을 배우고 파이썬을 배워서 어떻게 통계를 내볼지에 관해 이야기를 많이 한다는 점을 종종 느낀다. 사실 그런 이야기를 들을 때마다 해당 학문에 대한 베이스가 없는 나는 언제 프로그램을 익혀야 하나, 이과생의 머리를 가지려고 노력해야 하나.. 하면서 많은 고민을 했었다. 그런데 감사하게도 이 책은 본업을 가진 내가 먼저 고려해야될 점은 데이터 그 자체가 아니고, 데이터를 불러와야 하는 나의 본업이라고 말해주고 있는 것 같다. 따라서, 처음에 데이터를 어떻게 접해야 할지 막연하기만한 비전공자들에게 데이터 접근에 대한 문을 열어줄 수 있는 중간자 역할을 하는 책이 아닐까하고 생각해본다. 


나의 본업에 어떻게 활용해볼 수 있을까? 

현재 나의 직무는 프로덕트 디자인이다. 프로덕트 디자인이란, 사람들에게 사랑받는 디지털 프로덕트를 디자인하고 그 프로덕트가 지속적으로 생존할 수 있도록 발전시켜나가는 역할을 한다고 생각한다. 결국 전체적인 것은 아니지만 부분적으로는 PM, PO의 역할도 겸하는 것이고 개발자의 개발 결정 사항에도 참여를 하게 된다. 또한 프로덕트의 외형에 대해서도 많은 고민이 필요하다. 

좋은 프로덕트를 만들기 위해서는 많이 보고, 관찰하고, 정보를 캐내야 한다. 

왜 만들어야 하지? 어떻게 온보딩해야 사람들이 접근하지? 어떠한 조건으로 만들어야 리소스 낭비가 덜하지?하고 질문했을때 그것에 대한 당위성을 논리적 오류없이 말해줄 수 있기 위해서... 

데이터가 정말 필요한 것이 아닐까 싶다. 

물론 데이터는 리서치를 위한 하나의 부분일 뿐이다. 

데이터 자체만으로는 우리가 그 대상을, 현상을 '안다'라고 할 수 없다. 

동일한 조건을 가진 두 페르소나를 가지고 직접 찾아봤더니 실제로 인간성에 있어 차이가 극명한 인물 두명을 발견하게 되었다는 점도 있기 때문에, 데이터 자체를 가지고 완전한 신뢰를 하는 것은 분명 오류가 있다. 

따라서 고객에게 진정 사랑받고 오래가는 프로덕트를 만들기 위해서는 객관적 정보 외에도 정성 리서치가 중요하고 직접 보고 관찰하는 '직관'도 중요할 것이다. 

데이터를 활용한 지표 산출과 정량 리서치 그리고 정성리서치를 어떻게 적절하게 조화할지는 좀 더 자세히 공부해봐야 겠다. 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari