brunch

Data는 특정 상황을 포함해야 한다.

by 김응석

많은 사람들이 데이터(Data)라고 하면 숫자를 먼저 떠올릴 것이다.

하지만, 데이터는 숫자와 더불어서 기호, 문자 등을 다 포함하는 개념이다. 그렇다면 의미 있는 데이터가 되기 위한 필요충분조건은 무엇일까?


개인적으로는 “실무적으로 고민하고 있는 문제를 해결할 수 있는데 도움이 되어야 한다”라고 생각하고 있다.

실무에서 고민하고 있는 문제는 수학문제처럼 정답이 있는 문제들이 아니다. 우리가 원하는 상태로 현재 상태를 변화시켜야 하는 것이 실무에서 접하는 많은 문제들이다.

제조 현장의 기본적인 문제들은 “품질의 향상과 유지”, “생산성의 유지와 향상“, “비용의 감소”등 QCD로 요약할 수 있다.

이런 실무적인 문제를 해결하기 위하여 소위 사람의 경험과 직관에 의한 “휴리스틱"한 방법이 아니라 Fact(사실)에 근거하여 보다 쉽고, 빠르고, 정확하게 문제를 해결하기 위하여 활용하는 것이 바로 데이터인 것이다.


실무에서 발생하는 문제 해결에 도움을 주기 위해서는 “특정 상황”과 함께 데이터가 수집되어야 한다.

그리고, 특정 상황을 이해하고 어떤 형식(숫자, 기호, 문자, 사진 등)이 효과적인지를 사전에 결정한 다음 데이터를 수집해야 한다.

스마트팩토리를 도입한 기업을 방문해서 그동안 수집한 데이터를 분석해서 실제 제조 경쟁력 향상에 도움이 될 수 있는 “시사점"을 도출하기 위해 분석을 진행한 경험이 있다.

적지 않은 경우 ‘특정 상황’과 관련한 내용이 충분하지 않아서 오랫동안 많은 양의 데이터를 수집했음에도 불구하고 “Insight”를 찾기가 어려운 경우를 만나곤 했었다. 참 안타까운 순간이었다. 이 또한 기업의 입장에서 보면 투자와 비용이었는데…


데이터에 대한 중요성이 그 어느 때 보다도 중요하다고 강조되고 있는 요즘, 데이터를 수집하기 전에 실제 문제를 해결하기 위한 데이터의 정의를 다시 한번 음미하는 것이 어떨까 싶다.


데이터는 “특정 상황"아래에서 특정 형식으로 수집한 일련의 숫자, 문자, 기호 등이다.

keyword
작가의 이전글통계학 전공자가 바라본 Data Science