데이터 분석 에세이
데이터 분석은 수많은 정보의 홍수, 데이터 속에서 무언가 패턴이나 인사이트를 찾는 과정이다. 이렇게 찾은 인사이트가 문제 해결의 실마리가 되기도 한다.
병목 현상을 발견하고 개선한다던가, 유저 유입률이 높은 부분을 집중 공략한다는 식이다. 문제 해결은 곧 수익 창출과도 연결된다. 비즈니스 모델에 도움이 될 수도, 공익에 보탬이 될 수도 있다
얘기에 앞서 한 일화를 소개한다. 집주인이 수도가 막혀 배관공을 불렀다. 배관공은 5분도 채 안 돼서 수리를 마쳤다. 나사를 한 부분 조이는 게 다였다. 배관공이 청구한 비용은 100달러. 집주인은 화가 났다. 그렇게 간단한 작업에, 재료값도 들이지 않았으면서 왜 그렇게 돈을 많이 청구하냐고. 배관공에게 따졌다.
배관공은 대답으로 청구서를 내주었다. 청구서엔 이렇게 적혀있었다. '어디가 문제인지 파악하는 데 든 비용 95달러', '나사 조이는 비용 5달러'. 일화는 이런 내용이었던 것 같다. 위 일화에서 '문제 파악'은 문제 해결의 대부분을 차지했다. 이렇듯, 문제를 정의하거나 파악하는 것은 매우 중요한 과정이다.
본격적으로 데이터 분석 과정과 나쁜 습관에서 벗어나는 과정을 관련지어 설명해볼까 한다.
아무리 나를 파괴시키는 나쁜 습관이라도 이게 문제라는 생각이 들지 않을 경우 벗어날 수 없다.
벗어날 이유가 없기 때문이다. 즉 습관에서 벗어나기 위한 출발점은 문제라는 인식, 혹은 문제 정의이다.
데이터 분석에서는 문제 정의에 앞서 현재 데이터에 대한 EDA(Exploratory Data Analysis)가 선행한다. 탐색적 데이터 분석. 데이터를 다양하게 시각화해보고, 분포를 파악하는 것이다. '왜 이런 분포를 띄고, 데이터 간의 관계는 왜 이런 것인지' 생각해야만 한다.
이 과정을 통해 문제를 정의하고 현황 분석을 진행할 수 있다. 이 글은 ‘습관을 데이터로 보고, 분석을 통해 문제를 정의할 수 있다면, 습관 개선의 출발점이 될 수 있지 않을까?’라는 질문에 대한 나름의 답이다.
나쁜 습관에서 벗어나는 과정과 위 과정은 어떤 관련이 있을까?
사람의 특정 시기의 사고와 행동. 이를 데이터로 볼 수 있다. 이 관점에서 보면, 습관은 데이터의 누적이라고 볼 수 있다. 우선, 습관이 먼저 문제인지 인식해야 한다.
문제 정의를 하려면? 데이터 분석에선 EDA가 선행한다고 했다. 자신의 현재 습관에 대한 EDA를 한다. 여기엔 현재 사고, 행동에 대한 관찰을 포함한다. 관찰로 패턴을 파악하거나 인사이트를 도출한다. 이를 위해 다방면으로 숙고해봐야 한다. 어떤 사고와 어떤 행동이며, '왜 그런 사고와 행동을 하는지’까지도.
숙고하는 과정에서 ‘왜’라는 질문이 등장한다. 저번에 말했던 ‘왜’라는 질문의 효과와도 겹치는 부분이다. 변화의 출발점인 것이다. 스스로의 행동을 관찰, 직시하고, '왜'라는 질문을 던지기. 이로써 현재 하는 행동에 제동을 걸 수 있다. 습관의 관성력에 벗어나, 잠시 멈춰 생각하게 된다.
EDA는 다각도로 이루어져야 한다. 한 사람의 사고와 행동이란 데이터는 현재만 있는 게 아니다. 과거와 영향을 미칠 미래 또한 포함되어 있다. 그렇기에, 이 데이터가 과거부터 현재 내 삶에 끼친 영향을 파악한다. 혹은 현재 데이터가 미래의 내 삶에 미칠 영향을 파악해야 한다.
과거에 내가 하는 사고와 행동이 어떠했기에 지금의 내 모습이 이런 것일까? 그리고 이 삶은 내가 진짜 원했던 삶인가?
현재 내가 하는 사고와 행동이 미래에 초래할 결과는 무엇일까? 그리고 그 삶은 내가 진짜 원하는 삶일까?
과정은 단순하다. 누구나 해봤던 행동들일 것이다.
가령 나의 경우 하루 온종일 피곤한 느낌이 들고 자주 졸았다.
나의 생활 패턴을 관찰해보았다. 나는 미라클 모닝을 위해 6시 즈음에 일어났다. 아침 일찍 일어나서 자기계발을 해야 하기 때문이다. 이까지는 좋았다.
문제는 취침 시간이다. 나는 새벽 2시에나 잠드는 습관을 가지고 있었다. 왜 늦게 잘까? 핸드폰을 만지고 뭔가 재밌을만한 거리를 찾아 헤맸다. 그 결과 다음날 피곤하고, 피로가 점차 누적돼서 업무 생산성도 떨어졌다. 자기계발도 소홀하게 됐다. 이 패턴을 반복하게 될 경우 내가 원하는 삶과 점차 멀어지게 될 것이다.
경각심이 생겼다. 변화해야겠다는 마음이 들었다. 문제라는 인식이 생긴 것이다.
뭐가 문제인지도 모를 경우, 암담하다. 하지만 문제가 무엇인지 알았다. 이제 해결할 일만 남았다!
이는 모두 습관이란 시간을 포함한 사고, 행동 데이터를 분석한 결과였다. 추가적으로 더 살펴볼 수 있는 게 있다면 귀중한 보석을 발굴한다는 느낌으로 하나씩 점검해보아야 한다. 그게 탐색적 데이터 분석이다. 이를 통해 문제를 보다 명확하게 정의할 수 있다. 또는 새로운 문제를 발견하기도 한다.