brunch

매거진 Freak Ideas

You can make anything
by writing

C.S.Lewis

by 괴짜분석가 May 27. 2023

데이터 활용 최대의 적 - 데이터 끼워넣기

해석하고 싶은 대로 끼워 넣는 것은 데이터로 일하는 게 아니다

데이터가 강조되는 시대에서 데이터 문법에 맞는 사고와 설득은 필수입니다. 하지만 데이터 문법은 흔하게 파괴되어 사용되고 있습니다. 저는 그중 최악은 하고 싶은 말을 먼저 만들고 그 안에 수치를 채워 넣는 것이라고 생각합니다. 논문을 쓰거나 리포트를 쓸 때 저를 포함한 다수의 학생들이 하던 먼저 내용을 다 채워 넣고 얻어걸려라는 식으로 그 내용에 적절한 논문을 인용하는 것과도 같습니다. '아는 게 힘'이라는 속담이 있는 반면 '모르는 게 약'이라는 속담도 있는 것처럼 찾으면 끼워 맞출 수 있는 건 어디에나 있습니다. 다만 이런 논문이나 리포트는 학생일 때는 넘어갔을지라도 프로의 영역에 가서는 수준 높은 곳에 사용될 수 없습니다. 근거가 부실하기 때문이죠.



하고 싶은 말이 먼저 있고 이후에 데이터를 붙여 넣는 것은 데이터 문법에 맞지 않다


데이터 문법 파괴자의 가장 큰 특성은 하고 싶은 큰 얘기가 먼저 있고 그 근거자료로 데이터를 넣는다는 것입니다. [김미경의 마흔 수업]이라는 책에는 [아프니까 청춘이다] 책에 나온 인생시계 개념을 활용해 40대를 위로합니다. 대략적인 내용은 이렇습니다.


- 100세 시대에 내 나이를 하루 24시간으로 환산하면 10살씩 늘어날 때 2.4시간입니다

- 따라서 40세이면 9시 36분입니다. 하루를 시작할 시간이죠

- 이제 하루를 시작할 시간이니 40대들은 본인들이 아직 완성되지 않았다는 것에 좌절하지 말라합니다


이 내용은 전형적인 데이터 문법 파괴자의 문법이며 틀렸습니다. 좋은 말을 통해 상처받은 영혼들을 위로하고자 하는 마음은 이해가 되지만, 데이터적으로 생각하면 일종의 밑장 빼기 기술을 사용한 것입니다. 어떤 포인트가 틀렸을까요?

나이를 하루 24시간으로 비유한 것은 보다 익숙한 단위로 환산시켜서 이해도를 높이려는 목적이 있습니다. 하지만 이 과정에서 정상적이었던 데이터가 의미가 손상될 수는 없는지 생각해야 하는데요. 실제로 우리는 평균적으로 하루 8시간을 잡니다. 사람마다 다르겠으나 대개 6~22, 7~23, 8~24 시 동안 깨어있죠. 편의상 8시에서 24시까지 깨어있는다고 해보겠습니다. 그렇다면 100세의 비유를 할 때 자는 시간을 제외하고 8시부터 24시까지로 비유했어야 합니다(일단 100세까지 사는 것은 맞다고 하겠습니다). 그러면 10살당 1.6시간이 됩니다. 그럼 10세에 9시 36분, 20세에 11시 12분, 30세에 12시 48분, 40세에 14시 24분이 됩니다. 그러면 40대는 점심 먹고 오후 근무에 어느 정도 몰입하고 있을 시간이지 하루를 막 시작한 시간이 아니게 됩니다. 현실적으로 우리의 직관과 어느 정도 비슷하면서도 생각보다 퇴근할 때까지 시간이 많이 남았구나라는 생각이 들어서 저에게는 이것이 더 위로가 될 것 같습니다.


무엇이 당신의 나이대를 객관적으로 설명하였을까요?


잘못된 인생시계와 정상 인생시계의 나이대를 비교해 보면, 40대는 아침 시간이라는 위로가 얼마나 어처구니없는 사기였는지 알 수 있습니다. 무조건 당신은 아직 젊다 당신은 아직 할 수 있다는 얘기를 하려다 보니 잠을 안 자는 사람의 스케줄을 만들어놓고 심지어는 하루 시작을 00시에 시작하는 사람의 스케줄로 만들고 당신은 이제 막 아침을 시작했다고 하니 잘못된 표현이 되었습니다.

회사에서도 상황과 맥락만 바뀌었을 뿐 이러한 상황은 빈번하게 발생합니다. 데이터 역량이 필수인 시대라고 해서 데이터를 가져오면 만사가 해결되는 시대가 아닙니다. 그 데이터가 논리적으로 우리가 설득하려는 주제에 적절한지 의도치 않게 눈속임이 된 것은 없는지 검토하고 사용해야, 검토하고 받아들여야 진짜 시대가 원하는 데이터 역량에 다가가는 것입니다.

매거진의 이전글 데이터에 대한 얘기들
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari