#데이터사이언스 #데이터마이닝 #데이터분석 #프로세스마이닝 #라라크루
로봇의 사생활?? 을 존중하고 보호해야 할까??
데이터를 분석해 보니, 사람에 대한 모든 정보는 개인정보보호법으로 쉽사리 오픈하기 어렵지만, 기계와 로봇들의 데이터는 공개 분석이 많이 되고 있는 세상이다.
나는 이제 로봇이 남긴 데이터로 그 발자취를 따라서 무엇을 했는지 분석을 하고자 한다.
언제, 어디서 밥을 먹고 (충전), 일을 수명을 받고 나서 (무엇을), 그 일을 해내기 위해서 일들을 어떻게 해가는지(어떻게)에 대해 파헤쳐보려고 한다. 그리고 잘못한 부분이 없는지도 말이다.
살짝 무섭다는 생각도 든다. 누군가 내 데이터를 이렇게 바라보고 분석을 한다면 나는 어떤 마음일까?
인간으로 태어나서 인간의 존엄성을 갖고 보호받고 살고 있다는 것이 새삼 감사하다고 생각된다.
raw 데이터를 보니 먼저 어떤 일들을 하는지에 대해 우리가 이해하고 싶은 방향으로 간단한 설명이 필요하다.
Annotation 작업이라고 할 수도 있고, 간략한 Description을 남기는 부분이라고도 할 수 있고, Data 속성값 정의라고도 할 수 있다. 로봇의 상태는 여러 가지 컬럼값으로 구분이 되어있고, 해당 컬럼의 다양한 형태의 데이터로 저장이 된다. 데이터의 종류는 크게 문자와 숫자로 나뉘고, 우리 로봇은 숫자인 경우 특정한 형식을 갖고 있다면 시간 데이터를 포함하고 있다.
로봇이 한 과정을 보낼 때마다 하나의 행 데이터가 생성이 되고, 각 행값에 대해 상태 설명을 하였다. 그리고 반복되는 패턴이 있다는 것도 발견하게 된다. 로봇이 약제 배송을 할 때 반복되는 프로세스를 진행하면서 배송을 하고 있다는 것을 알 수 있는 대목이다.
로봇의 데이터를 보면 약을 받고 나서, 이후에 엘리베이터로 이동을 해서, 엘리베이터를 호출하고, 기다렸다가, 탑승을 하고, 원하는 목적 층을 누른 다음에, 내리고 나서, 병동 간호사에게 약제를 배송한다.
로봇들은 이 과정을 반복해서 약을 배송 업무를 하고 있었다.
일련의 모든 데이터를 분석해서 결과를 만들어 보았다. 이 한 장의 데이터를 가시화하기까지 수많은 trail error를 보내면서, 분석 방법을 세팅하고, 데이터를 전처리하고, 차트 하나하나의 필터를 바꾸고, x, y, z 축 값을 설정하는 등 단순 반복하는 프로세스와 미세한 조정을 통해서 내가 원하는 데이터 탐색 분석의 결과를 도출할 수 있었다. 이 분석과정에 있어서 가장 시간을 단축하도록 도움을 준 분석 방법은 프로세스 마이닝이라는 기법이다. 이 부분은 다음 글에서 다시 다룰 예정이다.
탐색 결과 설명
1. 상단 왼쪽 : KPI 수치로 배송을 몇 건 수행하였고, 시간은 얼마나 걸렸는지 알 수 있음
2. 상단 오른쪽 : 배송을 위해 프로세스 결과 맵
3. 중간 왼쪽 : 시간대별 배송 건수 및 시간을 알려주는 Bar chart
4. 중간 오른쪽 : 각 배송에 대한 Dot chart
6. 하단 왼쪽 : 프로세스 리스트
7. 하단 오른쪽 : 단계별 소요 시간 Box chart
이렇게 하여 로봇들의 데이터에 대한 탐색 분석을 마쳤다.
끝내고 보니 필드에서 충분히 알고 있던 사실 외에 크게 다를 바 없을 수도 있다. 하지만 데이터가 더 많아질수록, 에러가 더 많아질수록, 하나하나의 개별 이벤트에 대한 의미를 찾아갈 때 도움이 될 뿐만 아니라 데이터를 숫자, 문자가 아닌 시각화해서 볼 수 있다는 그 자체만으로도 의미가 있는 탐색 분석이라고 말할 수 있다.
특히 머신러닝이나 딥러닝을 통해 예측 정보를 찾고자 할 때 현재 데이터를 정확하게 이해하고 있어야지만 적합한 모델을 선정하여 분석이 가능하기 때문에 탐색 분석의 과정은 다음 분석을 위한 빼놓을 수 없는 중요한 단계이다.