brunch

You can make anything
by writing

C.S.Lewis

by 성시리 Apr 12. 2023

[데이터 문해력] 읽은 책 지식으로 만들기

데이터의 활용보다 생각법을 알려주는 책

책에서 알려준 요약

1. 올바른 목적을 설정하고
2. 그 목적에 따라 데이터를 활용해서
3. 적절히 제시한 결과를 결론으로 끌어낸다. 





Data..

Data..

Data..


데이터에 대해서 알고 싶어서 여러 책을 읽을 때마다 느끼는 것인데 공통되게 말하고 있는 것은 데이터는 결국 도구이고 나의 논리를 얼마나 탄탄하게 가져가는지가 중요하다는 것이다.


이번에 읽은 [데이터 문해력]은 우아한형제들의 사내 필독서로 꼽힐 만큼 유명한 책이다. 그래서 그런지 확실한 인사이트가 있었고 나의 생각에도 나름의 큰 울림을 줬다.


앞으로의 현업에서도 이 책의 주제를 기억하고 적용하기를 바라면서 내용을 정리해 보고자 한다.


데이터를 바라보는 자세

필자는 기본적으로 '생각'에 큰 가치를 두고 있다. 데이터를 활용하고 분석해야 한다고 요즘 유행처럼 번지고 있지만, 이를 해석하고 적용하는것은 사람이기 때문에 데이터에 매몰돼서는 안된다.


마냥 데이터를 보면서 인사이트나 문제 정의를 발견하기를 기다리는 것은 탐정이 단서를 얻기를 바라면서 모든 CCTV를 돌려보는 것과 같지 않을까?


1. 생각하고

분석 전에 문제 및 목적을 정의하고 가설을 구축한다.


2. 작업하고

분석을 위한 기술과 지식을 활용한다.


3. 생각한다.

분석 결과에 대한 해석 및 스토리를 구축한다.

                    

책에서 말하는 데이터 활용 프로세스

책에서 하나의 스토리로 말하고 있는 활용 프로세스는 아래의 단계를 따른다.


핵심만 정리하면 나 자신이 알고 싶은 것(목적)에 따라 데이터를 수집하고 분석해서 그 결과를 검증하고 결론으로 연결하는 것이다.


1. 겉으로 드러난 현상

2. 목적 및 문제를 정의

3. 지표를 결정

4. 현재 상태를 파악

5. 평가

6. 요인을 분석

7. 해결 방안을 모색


데이터 활용에 실패하는 이유


1. 풀고자 하는 문제가 명확하지 않다.


나의 생각을 논리적으로 상대방에게 전달하고 이해시키고 내가 원하는 결론으로 도달시키기 위해서는 객관성을 갖춰야 한다. 나는 무엇을 알고 싶은가? 무엇을 해결하고 싶은지? 에대해서 사전에 충분히 고민하지 않는 다면 논리와 설득력을 갖추기 어렵다.


2. 정의한 문제와 사용 데이터가 일치하지 않는다.

Are you using the right data?


문제와 목적을 올바르게 정의하였다면 올바른 데이터(지표)를 활용하고 있는가에 대해서 살펴봐야 한다. 만약 문제를 제품의 품질을 올리는 것이라고 한다면, 품질의 기준이 사용자의 만족 평가라던지, CS의 인입 수라던지, 아니면 제품의 로딩 속도라던지 등으로 목적에 알맞게 정의해야 한다.


3. 결과와 평가는 다르다.


가치있는 정보는 구체적인 행동을 특정하거나 판단을 내릴 수 있어야 합니다. 또한, 평가를 잘하기 위해서는 비교할 수 있어야 합니다. 


단순하게 우리의 고객은 ㅇㅇ한 행동을 보이고 있습니다. 라는 것은 데이터의 정이리자 결과일 뿐이고 좋은 데이터 활용은 "어떤 목적으로/어떤 것을 확인하고자 xx 데이터와 yy 데이터를 비교하였고 ㅇㅇㅇ라는 결론을 얻게 되었다." 라고 말할수 있어야 한다.


4. 결론을 도출할 수 있어야 한다.


"A 상품의 매출은 B 상품보다 적다." 는 데이터의 결과일 뿐이다. 이런 데이터를 확인하였다면 다음과 같은 질문에 대답할 수 있는 분석이 필요하다. A 상품이 B 상품보다 매출이 적은 이유는 무엇인가? A 상품을 B 상품만큼 팔리게 하려면 어떻게 해야 하는가?


1) 현황 파악 완료, 분석 및 비교를 통해 문제점 도출

2) 그 결과에 이르게 된 근거 및 원인도 제시되었는가?

3) 원인과 결과의 '연결성'에 주목하자 (논리적으로 연결이 되는가?)


이러한 해결방안 도출은 문제를 일으키는 원인에 대해서 취해야 한다.


올바른 원인을 찾는 사고방식과 방법


1) 원인 후보를 나열한다.

2) 지표를 결정한다.

3) 관련성을 확인한다.


원인과 결과 사이에는 반드시 연관 관계가 있다. 관련성을 데이터로 확인했을 때 데이터에 원인을 잘 분석했다고 할 수 있다. 또한, 관련성이 있다고 하더라고 직접적인 관련성이 있는지, 우연은 아닌지에 대해서도 고민을 해야 한다.


5. 끈질기게 고민하고 고민한다.


데이터를 분석하는 과정에서 결과만을 정리하고 끝나지 않고 결과를 통해 구체적인 판단이나 행동으로 연결되고 문제와 결과에 대한 원인을 충분히 고려했는지가 매우 중요합니다. 


해결 방안을 제시할 때는 어째서 다른 방안이 아닌 그 해결 방안이어야 하고 그로 인해 어떤 것을 실현 또는 해결이 가능한지? 그리고 효과적인 결과가 나올 것이라는 근거는 어디에 있는가? 에 대해 고민해야 한다. 이러한 고민이 충분히 이뤄지지 않으면 논리적인 비약이 생기거나 관련성이 떨어진 결과물이 나올 수 있다.


책을 읽으면서 가장 나의 상식에 충격을 줬던 것은 원인이 정말 원인인가? 에 대해서 고민을 했는가 이다. (재밌었던 예시는 아래에 함께 첨부)


기본적으로 내가 지금 생각하고 있는 것이 원인인지, 문제인지, 해결 방안인지에 대해서 정확하게 생각할 수 있어야 합니다.

유저들이 콘텐츠를 공유를 하지않아!

라는 생각은 처음엔 문제라고 생각했지만, 진짜 문제는 서비스의 인지도가 낮은 것이었고 그 이유는 타겟 고객이 서비스를 접할 기회가 없었던 것이었다. 그리고 해결책은 유저가 콘텐츠를 공유하게 하는 것이다. 라는 생각으로 이어질 수 있습니다.

그러면 유저들이 콘텐츠를 공유 하지않는 다는 것은 결과적으로 문제가 아니라 해결책이 됩니다.


6. 데이터 안에는 답이 없다.


책의 주제를 관통하고 있는 주제 중 하나로 방법론은 우리가 해답을 찾게 해주는 도구에 불과하고 우리의 논리적인 생각이 가장 중요하다는 것을 말하고 있다.


데이터의 방법론과 기술로는 문제를 해결할 수 없다. 데이터에 의존하지 않고 스스로 목적과 문제를 정의해 필요한 데이터나 분석 범위를 얼마나 넓은 시야로 디자인할 수 있는가가 중요하다.


이것을 잘하기 위해서는 논리적인 사고를 통해 문제와 원인을 진단해야 한다. 논리적 사고는 문제를 구조화하고 정리하면서 생각을 하는 것을 말하고 다음과 같이 표현할 수 있습니다. 


문제: 시간외 근무 시간이 많다.

1. 회사 내부 문제

1) 업무 문제
a- 양적 문제
b- 질적 문제

2) 사람 문제
a- 양적 문제
b- 질적 문제

2. 회사 외부 문제
1) 고객 문제


구조화해서 정리하다 보면 즉흥적으로는 알수없는 생각을 하게 되고 왜 이 데이터를 사용해서 분석했는가? 라는 질문에 대해서도 논리적인 설명이 가능해진다. 떠올린 아이디어에 대해서는 스스로 반박해보면서 다른 아이디어를 도출할 수 있다. 자신의 생각을 중립에 놓고 합리적인 사고를 할 수 있도록 노력해야 한다.


1. 방문 고객이 줄어든 것은 홍보 횟수를 줄였기 때문이다.
2. 홍보 횟수 말고 다른 문제는 없을까? 홍보 횟수를 늘려도 해결되지 않으면 다른 원인은 뭘까?
3. 홍보가 고객에게 도달하지 않는 것일지 몰라
4. 홍보 횟수가 늘고 잘 도달하였는데도 방문 고객이 줄어들면 어쩌지?
5. 홍보 내용이 어필이 안되거나 이해가 어렵지는 않을까?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari