제조업 데이터 분석 노하우 - 1
데이터 분석을 하려면 왜 도메인을 알아야 할까?
2 가지에 대해서만 얘기해보려 한다
1. 문제 정의
과제를 수행하기 이전에, 현업과 비즈니스 측면을 고려하여 문제를 정의해야 한다
이를 위해선 현업 엔지니어와 도메인을 고려한 커뮤니케이션이 필요하다
그런데, 커뮤니케이션은 혼자 하는걸까?
도메인 관련하여 아무것도 모르는 사람과 무슨 대화가 되겠는가?
이는 일이 아니더라도 친구와의 대화를 생각해봐도 마찬가지다
제조 데이터 분석가는 관련 도메인에 대해 4M(설비, 작업자, 원재료, 공정) 관점에서 철저히 학습하고 인지해야 한다
이후, 현업과 커뮤니케이션을 통해 문제 정의를 한다면 비즈니스 문제는 자연스레 도출이 가능하다
어느 정도 수익이 발생할 지는 현업에서 충분히 판단이 가능할테니
즉, ‘문제 정의’를 위해선 도메인 지식이 필수적이다!
2. 가설 수립
문제 정의가 완료된 후, 분석 진행을 위해서는 가설 수립을 먼저 해야 한다
제품을 만드는 단계가 A, B, C가 있는데 B 단계에서 문제가 발생하여 이를 해결하는 과제를 진행한다고 예를 들어 보자.
그럼 보통 B 단계에서 최소 변수가 100개 이상은 될 것이다
분석 가설 수립을 몇 백개 되는 모든 변수를 활용하여 분석을 진행할 것인가?
물론, 안될 건 없겠지만 중요 인자를 도출하는 데 시간은 배로 소요될 것이다
최소한 현업과 도메인 관점의 대화를 통해 지름길인 가설을 먼저 수립해봐야 한다
해당 가설을 토대로 분석을 진행했음에도 유의미한 인사이트가 도출안된다면?
그땐 도메인을 고려하여 분석가의 감이나 다른 변수들을 활용할 필요가 있다
반대로, 통계적 기법 중 step-wise와 같은 단계적으로 중요 변수들을 선별하면 되지 않냐고 반문할 수 있다
그렇게 선별된 변수들이 현업 측면에서 통제가 불가능하여 문제를 해결할 수 없다면?
이 외에도 현업을 설득할 수 없다면?
그땐 데이터 분석가는 어떤 측면에서 현업을 지원할 수 있을 것인가?
데이터 분석가는 의사결정을 지원하는 것이지 의사결정을 하는 직업이 아니다
특히 제조업에서는 무조건이다
말이 다른 길로 새기 전에 여기서 도메인 지식의 중요성 관련 글은 마무리하겠다!