brunch

You can make anything
by writing

C.S.Lewis

by 일해라 물만두 Apr 25. 2024

데이터 활용은 문제 정의에서 시작한다

카시와기 요시키, ≪빅데이터 시대, 성과를 이끌어 내는 데이터 문해력≫

조직에서 데이터 기반 의사소통을 해야 한다고는 알고 있지만 정작 데이터를 제대로 활용하는 경우는 많지 않다. 데이터를 수집하고 가공해서 ‘매출이 떨어지고 있습니다’라는 결과를 알아냈다 하더라도, 그래서 어쩌라는 말인가? 매출이 왜 떨어지고 있는지, 매출을 끌어올리려면 어떻게 해야 하는지 알아야 한다. 하지만 데이터를 단순 ‘판독’만 해서는 이런 내용은 알 수 없다. 결국 단순히 매출이 떨어지고 있다는 사실 하나를 알아내기 위해서 그 어렵고 번거로운 데이터 수집과 가공 과정을 모두 거친 셈이다.


이 책은 데이터를 통해 매출 감소와 같은 문제를 식별하는 것뿐만 아니라 그 원인을 분석하고, 해결 방안을 모색하는 과정에서 필요한 데이터 문해력의 중요성을 이야기한다. 책에서는 크게 두 가지 측면에 집중한다.   

데이터 분석 과정의 이해: 단순히 데이터를 수집하고 판독하는 것을 넘어서 분석을 통해 문제의 원인을 파악하고 가능한 해결책을 도출하는 일련의 과정을 서술하고 있다. 데이터를 통해 문제의 본질을 이해하고, 보다 근본적인 해결책을 모색하기 위함이다.

의사결정 과정에서의 데이터 활용: 데이터를 통해 얻은 인사이트는 결국 실질적인 의사결정에 활용되어야 한다.




데이터 문해력의 핵심은 데이터 안에 답이 있다고 가정하는 것이 아니라, 올바른 질문을 던지고 그에 대한 답을 데이터를 통해 찾아가는 과정에 있다. 

데이터 활용은 명확한 목적과 문제 정의에서 시작해 적절한 지표 선택, 현재 상태의 파악, 평가, 원인 분석, 해결 방안 모색, 그리고 최종적으로 결론 도출까지 일련의 단계를 따른다.

저자는 데이터 활용에 실패하는 주된 이유로 명확하지 않은 문제 정의와 목적에 부합하지 않는 지표 선택을 든다. 문제 정의가 명확하지 않을 경우 분석의 방향성이 결여되어 결과적으로 의미 있는 인사이트를 도출하는 데 실패할 확률이 높아지며, 분석 결과의 해석과 응용이 어려워 실질적인 의사결정에 도움을 주지 못하게 된다.


지표 결정 단계에서는 목적에 부합하는, 즉 해결하고자 하는 문제와 직접적으로 관련 있는 데이터를 선정하는 것이 중요하다. 이 과정에서 가장 흔한 실수는 목적 없이 데이터를 무작정 수집하고 가공하는 것이다. 목표를 명확히 하여, 그 목표를 달성하기 위한 핵심 지표들을 정의해야 한다.


그 다음으로 데이터 분석을 통해 현재 상태를 파악하고 평가를 내린다. 이 단계에서 결과와 평가는 구분되어야 한다. 결과는 단순히 데이터에서 도출된 사실을 나타내는 반면, 평가는 이러한 결과를 바탕으로 어떤 행동을 취할지, 어느 쪽이 더 효율적이거나 중요한지를 판단하는 근거가 된다. 평가를 위해서는 비교가 필요한데, 비교 시에는 비교의 결과가 결론으로 이어지는지, 비교 대상이 되는 데이터 사이에 유의미한 차이가 있는지 유의해야 한다.


원인 분석은 문제를 일으키는 원인을 찾아내는 단계다. 해결 방안은 문제 자체가 아니라 원인에 대해 실행되어야 하기 때문에 매우 중요한 단계라 할 수 있다. 원인 분석은 세 단계로 이루어지는데, 첫 단계인 원인 후보 나열 단계에서 로지컬 씽킹이 사용된다. 원인이 될 수 있는 요소를 중복 없이, 누락 없이 구조화 하는 것이 관건이다.


원인 분석의 다음 단계는 관련 지표를 결정하고 지표들 간의 관련성을 확인하는 것이다. 이를 위해 문제와 결과를 나타내는 지표와 원인 후보 지표를 각각 세로축과 가로축에 배치하여 산포도를 작성한다. 산포도 분석을 통해 전체적인 경향, 그룹화, 이상치, 변화점 등을 파악하고, 상관분석을 통해 지표 간의 연관성을 확인한다. 이 때, 상관관계와 인과관계를 혼동하지 않도록 주의하며, 선형이 아닌 관계성도 존재한다는 것과 원인이 다수일 가능성도 염두에 두어야 한다.


해결 방안 모색 단계에서는 데이터를 통해 확인된 사실을 기반으로 효율적인 해결 방안을 수립하거나, 구체적인 행동 계획을 세우거나, 관계자들이 납득할 수 있는 판단이나 합의를 이끌어내야 한다. 해결 방안을 모색할 때는 다음과 같은 질문들에 답할 수 있어야 한다: 이 방안이 목적에 부합하는가? 왜 이 방안이 선택되었으며, 다른 대안과 비교했을 때 어떤 장점이 있는가? 이를 통해 어떤 문제를 해결하거나 어떤 목표를 실현할 수 있는가? 효과적인 결과를 예상할 수 있는 근거는 무엇인가?


개인과 조직이 데이터 활용 능력을 높이기 위해서는 이러한 방법론을 단순히 알고 있기만 해서는 부족하고, 실제로 데이터를 활용해 보는 경험이 중요하다. 데이터를 활용하는 과정에서 목적과 문제 정의에 충분한 시간을 할애하고, 데이터 활용을 업무 시스템에 명시하고, 구체적인 목표와 목적을 설정하고 공유하며 결과물에 대해 적절한 피드백을 할 수 있어야만 데이터 활용을 바탕으로 성장할 수 있을 것이다.



데이터 활용의 전체 단계 중 이 책에서 가장 중요하다고 강조하는 것은 ‘목적과 문제 정의’ 단계다. 보통 데이터 분석이라고 하면 숫자와 지표를 다루는 기술적인 과정에 초점을 맞추는 경우가 많다. 하지만 이 책에서 저자는 데이터 분석의 기술적인 부분보다는 문제를 정의하고, 원인을 도출하는 사고 과정에 더 많은 비중을 두고 있다.


아인슈타인은 말했다. “만약 나에 문제를 해결하기 위해 한 시간이 주어진다면, 문제를 정의하는 데 55분을 쓰고, 나머지 5분 만을 해법을 찾는 데 쓰겠다.”고. 데이터 활용 또한 실질적으로 데이터를 지지고 볶는 과정보다 어떤 질문에 답을 얻고 싶은지 문제를 정의하는 과정이 더 중요하다.


내가 ANTIEGG의 대시보드를 만들기 시작했을 때 나열한 지표들을 논리정연하게 제시할 수 없었던 이유는 과제의 목적과 해결하고자 하는 문제를 제대로 정의하지 않은 채 무턱대고 생각나는 지표를 열거했기 때문이었다. 이 책의 내용에서 가장 많은 분량을 차지하고 있는 첫 번째 단계를 건너뛴 채 바로 지표 설정부터 시작한 셈이다.


올바른 목적을 설정하고 그 목적에 따라 데이터를 활용해서, 적절히 제시한 결과를 결론으로까지 끌어낸다’는 본질적인 흐름을 중시하고, 과정 하나하나 신중히 밟아가야 합니다.(237쪽)


이 내용을 미리 알았더라면 얼마나 좋았을까? 책 <빅데이터 시대, 성과를 이끌어 내는 데이터 문해력>은 단순히 데이터를 다루는 기술적인 방법을 넘어서, 데이터 분석의 본질에 대해 깊이 생각하게 만든다. 나처럼 데이터 활용을 처음 시작하는 사람이 한 번쯤 꼭 읽어보면 좋을 책이다

매거진의 이전글 지원자님이 어떤 기여를 할 수 있는지 알려주세요
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari