어떤 데이터를 어떻게 활용할 것인가
편집자에 작가이고 기획자인 나에게 데이터는 늘 중요했다. 하지만 구체적으로 어떻게 중요한가를 물으면 그동안은 답하지 못했다. 하지만 기획을 할 때도 나는 늘 특정 수치와 통계들을 찾아봤고 편집자로 일을 할 때도 수치와 통계를 기반으로 사이즈와 판형, 쪽수를 정하고는 했다. 하다 못해 작가로 원고를 써야 할 때에도 나는 여러 자료들을 찾아보는 것을 중요하게 생각하는 편이다.
맞다. 나는 데이터를 좋아한다. 아마도 평균치의 사람보다는 분명 데이터의 중요성을 인식하고 데이터를 통해 뭔가를 도출하려는 성향이 강한 게 맞다. 통계학을 전공하지도 않았고 고등학교 1학년 이후로는 수학 책을 아주 덮어버린 대표 수포자가 통계나 데이터를 말한다는 게 우습지만. 그럼에도 나는 데이터를 매우 중요하게 생각한다.
하지만 데이터를 활용하는데 있어, 나름의 문제의식을 가지고 있다.
데이터를 좋아하는 내가 테이터에 대해 의심을 가지기 시작한 것은 아이들의 언어발달의 그래프가 내 아이들의 성장발달과 전혀 맞지 않았을 때였다. 평균치의 아이들의 교육 발달을 데이터로 한 숫자는 많은 엄마들을 혼란스럽게 했다. 특히 이 틀에서 많이 어긋나는 사례가 보여지는 아들 둘 엄마들이 보통 극심한 혼란에 빠지고, 나는 무려 아들이 둘인 엄마였다.
아동문학을 공부하고 어린이책 편집자로 일을 시작한 나는, 당연스럽게 아동학, 아동발달, 유아교육 등의 여러 책들을 섭렵해야 했고 그 과정에서 일정한 수치들을 근거하여 책을 만들었다. 그게 정석이고 표준이라고 믿으면서 아이들을 위한 다양한 책의 활동지를 작성했다. 자랑스럽게!
문제는 아이들 셋을 낳기 전에는 분명, 내가 해온 일에 대해 조금도 의심할 경험치가 부족했는데. 아이 셋이 태어나면서 나는 내가 그동안 배운 학문들을 정검해야 했다. 왜 내 아이들은 평균치에 못 미치거나 과도하게 넘치는 것인가? 평균을 벗어나는 아이들에 대해서는 어떻게 글을 써야 하는가?
수 없는 질문에 답을 찾아가는 과정에서 나는 내가 너무도 믿고 의지했던 통계의 함수들을 알아차린 것이다. 그렇다면 이 문제는 어떻게 해결 가능한가?
구체적으로 물어봐야 한다.
24개월인 우리 아이가 책을 좋아해요. 그런데 어떤 책을 골라줘야 할까요?
12개월인 우리 아이에게 하루에 몇 분 책을 읽어주면 좋을까요?
초등학교 입학하는데, 그림책을 모두 버려야 할까요?
초등학생인데, 그림책만 봐요.
얼핏 최선을 다해 구체적이고 싶은 지점들이 수치화된 질문이지만. 저 질문만으로는 답을 제안해서는 절대 안 된다. 100여 집을 다니며 책에 대한 이야기를 나누면서 내가 파악한 것은 얼핏 모두의 책장이 비슷비슷해 보이지만 아주 다른 배경을 가지고 있으며, 일정한 패턴들이 있지만 해당 패턴에 도달한 과정이 매우 다르다는 것이다.
맞다. 나는 빅데이터를 기반으로 한 통계도 좋아하지만 타깃 집단에 상세한 질문과 응대의 경험을 통해, 표본 집단의 특이성을 이해하는 일에도 관심이 많았고 꽤 오랜 기간 그 연구에 내 삶을 써 왔다.
5년여에 걸쳐 150여 집을 직접 방문하여 책장에 대한 이야기를 나누며, 개개인의 특이성을 살피며 가지고 있던 전문 지식을 바탕으로 상세 스케치를 해온 일. 초등 1학년부터 중학교 1학년까지 아이들에 북클럽을 운영하며 아이들의 독서 특이성을 이론과 실제로 살펴본 일. 중학교부터 고등학교 사춘기 자녀를 둔 어머님들을 5년여 동안 커피를 사고 밥을 사줘가며 사례를 수집한 일. 그리고 서점과 출판사의 이야기를 듣고 나만의 데이터를 만들려고 한 일. 중년 여성들을 대상으로 그들이 원하는 서비스가 무엇인지 알아보려고 마들렌플러스를 만들게 된 일까지.
나는 고려한다. 사람에 관한 것은 그 사람이 그 문제에 도달하게 된 다양한 상황, 시간, 공간, 관계, 개인성 등의 변수가 많고 그 변수로 인해 어떤 일들이 생기는지 예측을 해보는 훈련이 필요하다는 것. 예측된 상황에 맞게 시뮬레이션을 많이 해봐야 한다는 것.
즉, 어떤 아이의 독서 행태에 문제가 있다면 그 아이의 독서 행태의 문제가 발생된 섬세한 면들을 살펴야 한다. 그러니까 대상에 완전 밀착하여, 이 아이의 가정 형편과 부모님의 양육 방식. 아이의 발달 상태와 책을 대하는 태도와 아이의 생활 패턴 등. 이런 섬세한 활동이 파악이 되자면 종일 아이를 따라 붙어서 24시간 밀착 며칠은 봐야 한다고 생각한다. 즉 책장만 봐도 보이는 게 있지만, 24시간 밀착 며칠은 본 것 정도의 질문과 대답을 대상자와 나눠야 한다. 물론 내가 굉장히 많은 경험치를 가지면 24시간 며칠의 밀착 관찰을 하지 않아도 일정한 판단이 가능한 상태에 이르게 된다. 정말 150여 가정을 다니던 때에 처음 몇 집을 다닐 때의 어버버와 마지막 몇 집을 만날 때의 내 상태는 달랐으니까.
덕분에 나는 빅데이터를 기반으로 한 기술과 대상에 특이성에 집중한 표본 집단의 섬세한 사례 중심의 데이터를 어떻게 연결할지에 대한 관심을 깊게 가지고 있다.
그래서 제가 필터링한 모임들을 기반으로 섬세하게 타깃팅된, 실제적 활동 기반 데이터를 추출 공유하고 빅데이터를 해당 과제에 맞게 의미있게 결함하여 과제를 해결할 수 있는 방안들을 모색하는 일에 조금 더 집중된 시간을 써보려고 한다. 그리고 이걸 현재의 과학 기술로 발전시켜 세상에 필요로 한 서비스를 만들어 볼 생각이다.
나는 너무도 많은 수치에 가려진 작고 의미있는 데이터들에 관심이 많다. 즉 데이터 밖으로 튕겨나간 수치들에 의문을 품는 방식으로 특이성 분석에 집중된 보고서들을 아마도 만들어 내게 될 것 같다.
마케팅은 전공도 하지 않았고 통계학도 전공하지 않았지만 문제점은 늘 고민하고 개선할 방법을 찾는다.
난 지금 여기에 꽂혔다.