11 효과적인 자료수집 프로세스

by 김주연박사

앞서 어떠한 일을 하는데 있어서 실수율을 낮추기 위해서는 자료의 양이 많을수록 유리하다고 했다. 그러나 조직이나 개인이나 돈과 시간, 사람과 같은 자원은 한정되어 있다. 그래서 자료의 양은 많을수록 좋기는 하지만 적정 수준이라는 것이 있다. 자료의 양은 자료를 얻는데 필요한 시간과 밀접하게 연결되어 있다. 즉, 많은 자료를 구하기 위해서는 그만큼 많은 시간을 소비해야 한다. 그런데 문제는 수집된 자료가 모두 어떠한 일을 하는데 활용되지 않는다. 즉, 수집된 자료들 중 일부가 일을 하는데 필요하고 수집된 자료의 양이 많아질수록 활용되는 정도는 점차 낮아진다. 결국 과도한 자료 수집은 불필요한 일이 된다. 불필요한 일을 많이 하면 결국 실무자 입장에서 야근을 하고 휴일에도 일을 하는 불상사가 벌어지는 것이다. 야근과 휴일 근무가 많아지면 창의력이 낮아진다. 결국 빠르게 변하는 세상에서 필요로 하는 제품, 미래를 위한 먹거리를 생각할 시간이 부족해진다. 그래서 적정 수준의 자료 수집이 필요하다. 어떻게 적정 수준의 자료를 수집할 수 있을까?


자료를 수집하는데 있어서 가장 중요한 것이 바로 결과(output)다. 어떠한 일의 목적, 목표에 적합한 자료가 무엇인지를 판단해야 한다. 예를 들어, 어떠한 회사에서 매출을 높이기 위해 새로운 고객들을 확보하려고 한다. 그래서 앞으로 고객이 될 가능성이 높은 잠재 고객 리스트를 만들려고 한다. 잠재 고객 리스트를 확보하는데 국내외 기업들의 담당자 이름을 수집한다고 치자. 국내외 모든 기업들의 담당자 이름을 수집한 다음에 분석할 것인가? 아니면 우리의 제품을 구입할 만한 기업들의 담당자 이름만 수집할 것인가? 당연히 후자다. 그리고 이어서 해야 할 일은 자료의 질을 판단하는 것이다. 이 자료가 정확하고 신뢰성 있는 자료인지 판단해야 하는 것이다. 자료가 정확하지도 않고 신뢰성도 없는 자료라면 활용할 수 있겠는가? 예를 들어, 국내외 기업들의 담당자 정보를 파악하는데 기업명이 정확하지 않고 담당자 이름도 정확하지 않는다면 잠재 고객 리스트로 사용할 수 있을까? 사용하기 힘들다.


앞서 설명한 바와 같이 훌륭한 자료는 희소성이 관건이다. 희소성 있는 자료를 많이 얻을수록 문제를 해결하는데 결정적인 역할을 한다. 그러나 희소한 자료들은 그만큼 많은 시간과 노력을 필요로 한다. 그렇기 때문에 자료 수집에 있어서 적정 수준을 결정하는 것은 희소한 자료들을 얼마나 얻는가에 달려있다. 그래서 희소한 자료들을 얻는데 소요되는 시간을 예상해야 한다. 이러한 예상은 결국 그간 쌓아온 경험에 따라 직관적으로 판단할 수 있다. 실무자 입장에서 자신에게 희소한 자료가 필요한 정도와 자신이 쓸 수 있는 시간을 함께 고려하여 자료 수집 여부를 결정해야 한다.


효율적인 자료의 수집은 결국 프로세스로 이루어진다. 이러한 프로세스는 크게 세 가지로 나눠볼 수 있다.


첫 번째는 확인 단계다. 자료를 수집하는 목적과 결과(output), 자료 수집의 조건을 확인하는 것이다. 이 부분에서 명확히 하지 않으면 자료 수집 작업을 해도 성과를 기대하기 힘들다. 두 번째는 자료 수집을 어떻게 할 것인지 방법을 설계하는 것이다. 결과의 품질(quality)과 자료를 수집하는데 필요한 비용을 고려해서 설계해야 한다. 어찌 보면 자료 수집에 있어서 가장 중요한 단계다. 마지막은 자료를 실제로 수집하는 단계다. 자료를 수집하고 이를 가공하는 것이다. 목적을 달성하기 위해 필요한 양질의 자료를 얻기까지 실무자가 포기하지 않는 것이 중요하다.


그렇다면 경영진과 상사가 원하는 자료 분석의 형태는 어떠한 것일까? 크게 6가지가 있다. 첫째, ‘기술적 분석(descriptive analysis)’이다. 가장 기본이 되는 분석이다. 주어진 데이터를 요약하거나 집계하여 결과를 도출하는 방법이다. 예를 들어, 매출액, 평균 값, 설문 응답자의 남녀 비율 같은 것이 있다. 이러한 결과는 실무에서 가장 중요하게 생각한다. 물론 과거의 데이터를 단순히 계산하거나 집계하여 얻은 단순 사실이기 때문에 별도의 분석과정을 거치진 않는다. 둘째, ‘탐색적 분석(Exploratory analysis)’이다. 주로 가설을 수립하거나 어떠한 변수들 간의 관계를 파악하거나 트렌드를 파악하기 위해 사용한다. 셋째, ‘추론적 분석(Inferential analysis)’이다. 실무자는 주로 자료를 수집할 때 자원의 한계로 인해 샘플을 가지고 전체 모집단을 예상한다. 예를 들어, 한 회사의 남자 직원들을 대상으로 어떠한 제품에 대한 선호도를 설문으로 조사하여 남자들은 이 제품에 대해 어느 정도 선호한다는 결론을 도출하는 것이다. 이것이 추론적 분석이다. 넷째, ‘인과관계 분석(Causal analysis)’이다. 독립변수가 종속변수 간의 인과관계가 있는지 파악하기 위한 방법이다. 예를 들어, 광고비 집행의 정도가 매출액의 크기와 인과관계가 있는지 파악하는 것이 있다. 다섯째, ‘예측적 분석(Predictive analysis)’이다. 앞서 인과관계 분석에서 매출액의 크기에 영향을 주는 변수로 광고비 집행 하나를 분석했다면, 예측적 분석은 광고비 집행 외에도 영업사원의 역량, 제품의 경쟁력 등 다양한 변수들을 함께 분석하여 영향력을 예측하는 것이다. 마지막은 ‘메커니즘 분석(Mechanistic analysis)’이다. 가장 시간과 노력이 많이 필요한 방법이다. 독립변수가 종속변수에 영향을 미치는데 있어서 또 다른 변수들과 어떻게 관계를 가져서 영향을 미치는지 파악하는 것이다. 주로 학계에서 논문을 쓸 때 많이 사용되는 방법이다.


자료를 수집하고 분석, 가공하는데 다양한 방법이 있고, 결국 통계적 지식을 갖출수록 이러한 분석과 가공을 보다 훌륭하게 수행할 수 있다. 그래서 일부 실무자들은 통계적 지식을 갖추기 위해 공부한다. 특히, ‘R’과 같은 무료 통계 소프트웨어를 공부하는 사람들이 많아졌다. 왜냐하면 이러한 방법을 사용하여 수집한 데이터를 분석했을 때 훨씬 더 신뢰감을 줄 수 있는 결과를 만들 수 있기 때문이다. 앞서 설명한 바와 같이 경영진과 상사는 자신의 의사결정에 대해 거의 불안함을 가지고 있다. 이러한 불안함을 해소할 수 있는 방법은 보다 과학적인 방법으로 자료를 수집하고 분석, 가공한 결과를 제시하는 것이다.

keyword
이전 10화10 인정받는 사람들에게 자료는 무엇인가