낯선 도메인에서 문제 해결하기
2015년에는 경찰청 과학수사 자문단으로 잠깐 일할 기회가 있었습니다. 서울 소재 경찰서 및 경찰청 수사 지원 활동의 일환으로 다양한 유형의 범죄 데이터를 접하는 흔치 않은 경험이었습니다. 범죄 유형화, 피해자 프로파일링, 피해 심화모델 수립, 네트워크 분석, 범죄 통계 분석을 수행 했고, 범죄 조직 검거 및 현장 업무 효율화에 도움을 일부 드릴 수 있었습니다.
범죄 통계 분석 보고서도 현장에서 좋은 반응을 얻었습니다. 기존과 다른 시각이라는 평이 지배적이었습니다. 개별 분석은 건별로 상이한 분석 기법을 사용했지만, 문제를 접근하는 전체적인 틀은 공통점이 있었던 것 같습니다. 그것이 무엇인지 단계별로 살펴보겠습니다.
step 1. 피해자의 입장에서 출발하기
제가 민간인이라서 피해자의 입장에 감정 이입하게 되었고, 피해자가 하는 말과 행동에서 많은 힌트를 얻었다는 생각이 듭니다. 범죄의 결과로서 피해자가 발생하였다가 아니라, 피해자를 범죄의 주요 이해관계자로 놓고 피해자와 범죄자의 상호작용을 분석했습니다.
피해자가 어떻게 행동하니 범죄자가 이렇게 할 수 밖에 없었겠구나, 피해자를 이렇게 움직이게 하려니 범죄자는 이렇게 할 수 밖에 없었겠구나 등의 생각을 많이 했고, 이를 통해 범죄를 예방하거나 검거에 도움이 되는 특징과 타이밍(어느 시점에 예방 활동이 가장 효율적인지, 언제가 피해를 최소화 할 수 있는 이벤트인지 등)을 찾아냈습니다.
현장에서 업무를 하시는 분들은 범죄자의 검거가 모든 행위의 최종 목적이기 때문에 범죄자의 행동에 관심을 갖고 범죄자의 움직임에 먼저 집중합니다. 그리고 거기서부터 문제를 풀어가려고 시도 하는 경향이 강하고, 여기에서 전체 사건을 조망하는 큰 차이가 발생 했습니다.
step 2. 정보의 중립성 및 동등성
분석 작업에서 초심자의 행운이 상당 부분 작용했습니다. 도메인 전문가들이 보유한 정보의 선별 능력이나 선입견이 없어서, 모든 정보를 중립적이고 동등한 중요도로 봤다는 것이 오히려 장점으로 작용했습니다.
데이터나 조서를 보면서 ‘이건 왜 이런가요?’ ‘이건 이렇다는 뜻인가요?’ ‘이런 데이터도 남아있나요?’ 등의 질문을 했을 때, 실무 하시는 분들에게 ‘알고 보니 그게 아니네요’ ‘그렇게 해석할 수도 있겠네요. 생각해보지 못했어요’ ‘그런 종류의 데이터도 있겠군요’ 하는 대답들을 들을 수 있었습니다.
쌓아두고도 발굴되지 않아서 사용하지 못했던 데이터나 잘못 이해되고 있었던 데이터를 제대로 활용할 수 있었습니다. 이미 분석이 다 끝나서 멀리 창고로 보낸 조서 뭉치를 잔뜩 꺼내서 다시 분석하는 일도 자주 벌어졌습니다.
step 3. 답을 내는 분석
분석 대상이 되는 범죄의 예방책은 무엇일까, 검거율을 높일 수 있는 방법은 무엇일까, 피해자를 빠르게 알아낼 수 있는 방법은 무엇일까 등 실제 현업에서 바로 사용하실 수 있는 실용적인 답을 내려고 노력 했습니다.
사실의 나열은 사람들의 행동을 변화시킬 수 없고, 사람들의 행동을 변화시킬 수 없으면 본인의 기여를 인정 받기가 힘든 것이 데이터 분석가의 처지 입니다. 그래서 답을 내는 분석이 중요합니다.
다행인 것은 훈련을 통해 ‘답을 내는 분석력’이 길러집니다. 답을 내는 사람은 항상 답을 내고, 답을 못 내는 사람은 대부분 답을 못 냅니다. 이는 유능함과 무능함의 차이가 아니라, 답을 내는 방법을 익혔는가 아닌가의 차이 입니다.
step 4. 데이터로 백업하기
주장과 답을 데이터로 쌓아올렸습니다. 예를 들어, 어떤 종류의 범죄가 전문 직업화 되고 있다고 주장했다면, 범죄의 전문화라고 볼 수 있는 특징은 무엇과 무엇, 그리고 무엇이고, 이 특징들은 수치로 보면 이렇게 달라지고 있다고 설명했습니다.
이 과정에서 정리된 데이터들은 실무 현장에서 뿐 아니라 조직 내부의 보고 과정이나 유관 부서와의 협의 과정에서도 유용하게 사용되었습니다.
이상의 내용에서 피해자를 소비자로, 범죄를 판매/구매로 바꾸면 일반적으로 적용 가능 합니다. 범죄 데이터 분석 경험이 흔하게 하기 힘들기도 하고 상당히 흥미로운 주제 이기도 하지만, 이런 방식으로 일반화 할 수 있어서 그간의 경험을 글로 정리 해봤습니다.
이 글은 개인 블로그 alexsuh.blog의 범죄 데이터 분석과 동일한 글 입니다. https://bit.ly/36mVbIo