brunch

You can make anything
by writing

C.S.Lewis

by Maven Apr 23. 2020

빅데이터 분석을 위한 가설 설계, 첫 번째

가설을 세운다는 것에 대한 의미

데이터 분석을 하려면 당연하게도 데이터를 봐야 한다.

데이터를 보기 위해서는 어떤 데이터를 먼저 볼 것인지 고민하게 된다.

가설이라는 것은,

쉽게 말하면 어떤 데이터를 먼저 볼 것인지 선택하는 일이다.


흔히 데이터 분석을 하기 위해서는 '가설'을 세우는 것이 중요하다고 한다.

가설을 어떻게 세우는지 물어보면, 적지 않은 사람들이 '호기심'이라고 답하기도 한다.


많은 생각을 해야하고 많은 자료를 봐야하고

그래서 결국 어떠한 결론이 나올 수 있겠구나.. 예상하는 과정이라고 생각한다.


결과가 이렇게 나올 것 같아, 그게 맞는지 맞지 않는지 한 번 볼까?

마치 이렇게 접근하는 것을 '가설'이라고 생각하거나 말하는 사람들이 많다.


하지만, 내 생각은 좀 다르다.



가설은, 결론에 대한 것이 아닌, 과정에 대한 것이어야 한다.



앞서 얘기했던 것처럼,

어떤 데이터를 먼저 볼 것인지에 대한 궁금증이 되어야 한다.


그리고 그 데이터를 보다보니 다른 것이 궁금해진다면? 그것 역시 '가설'이다.

하나의 데이터를 보다가 생기는 궁금증이라는 것이 결국,


혹시 다른 부분에서는 이렇지 않을까?

그럼 다른 업종에서는 어떻지?

실제 사람들이 생각하는 부분을 좀 더 볼까?


하는 식.


즉 궁금함이라는 것은 결국 데이터를 분석하는 과정에 속하는 것이다.


그 궁금증은 결국 애초에 내가 생각하지 못했던 다른 데이터를 보게 만든다.

꼬리에 꼬리를 무는 과정이라는 것.


그게 데이터 분석에서는 '가설'이다.


수 많은 데이터 분석 방법, 과정, 분석이 필요한 분야나 아젠다가 있겠지만,

만약 Data Driven Marketing이라는 거창하고 모호환 목표를 쫓고자한다면

결과에 대한 가설이 아닌, 과정에서의 무수히 많은 가설(궁금증)과 마주해야 한다.


우리가 하는 분석은,

이 약이 효과가 있을까, 없을까?

주말에 쇼핑을 많이할까, 주중에 많이할까?

비가 오면 판매가 증가할까, 그대로일까?

놀이 동산에 오는 사람은 아이가 많을까, 어른이 많을까? 같은.


단편적인 결과만 제공하면 끝나는 분석이 아니기 때문이다.

수 많은 데이터를 쪼개고 합치고하는 과정에서

현상을 정의하고 그 원인을 파악하며, 기대 효과나 전망을 제시해야 한다.





예를 하나 들어보자.


고객이 이렇게 요구한다.

"왜 우리 제품이 목표만큼 팔리지 않는지 궁금해요"라고.


우리는 데이터 분석을 해야한다.


결과에 대한 가설을 세울 것인가? 


1. 그 제품은 2030세대가 좋아하지 않을거야. --> 연령으로 구분하는 타겟팅은 옛날 얘기다.

2. 그 제품보다 경쟁사의 A 제품이 더 좋을거야. --> 소비자가 품질을 명확하게 구분할 수 있을까? 

3. 그 제품을 잘 팔리지 않는 위치에 놓고 팔았을거야. --> 영업 얘기하는 게 아니잖아..



어떤 데이터를 먼저 볼 것인지 정해야 한다.

나는 앞으로 많은 데이터를 봐야하기 때문이다.

그리고 나는 아직, 내가 어떤 데이터들을 봐야하는지 알지 못한다.


단, 하나의 궁금증으로 시작해 보자.


1. 연령이나 성별로 제품을 좋아하는 정도가 많이 차이날까?

2. 시장에서 판매되는 10개의 경쟁제품 중 소비자는 몇 개나 고려할까?

3. 판매 채널은 몇 개지? 어떤 어떤 채널이 있지? 혹시 작년 대비 낮아진 채널이 있지 않을까?


그럴 것이다, 가 가설이 아니라

그렇지 않을까, 여러 번 물어보는 게 가설이다.



결론을 예상하거나, 예측하려고 하지 않기를 바란다.

우리가 마주하는 현상은, 하나의 이유와 원인이 존재하지 않는다.



데이터는 치열하게 보아야 한다고 나는 믿는다.

꾸준히, 그리고 지독하게 궁금해 하는 방법을 배워야 한다.




기회가 되면,

다음에는 "좀 더 잘 궁금해 하는 법", 그러니까


"가설을 세우는 방법론"에 대해 좀 더 말해보려고 한다.



(그러려고, 타이틀에 '첫 번 째'라고 붙여 보았다. ㅋ)








브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari