brunch

You can make anything
by writing

C.S.Lewis

by 패쓰파인더 Jan 31. 2022

2022년 무슨 범죄가 발생할 것인가?

112 신고, 범죄통계로 시계열 예측하기-1

경찰도 내일, 다음 달, 내년에 범죄가 늘어날지 줄어질지 궁금하다. 범죄 중에서 특히 어떤 범죄가 늘고 줄어들지를 알면 계획을 세우는데 도움이 된다.  이런 기법이 시계열 데이터 분석이다.


시계열 데이터는 시간의 흐름에 따라 관찰된 값들이다. 주식 가격 데이터, 실업률, 기후 데이터 등이 있다. 시계열 데이터를 분석하는 목적은 미래의 값을 예측하기 위함이다. 시간의 흐름에 따른 특성과 주기, 경향을 파악하기 위함 이다. 계절의 특(계절성)을 분석하며 불규칙성 등을 파악하기도 한다.


경찰에게 시계열 데이터로 활용할 데이터는 112 신고, 범죄통계가 있다. 매 순간 발생하는 신고와 사건 접수는 시간의 흐름에 따라 쌓인다. 원 데이터(raw-data)는 실시간으로 저장되고 일, 월 단위로 처리하여 활용할 수 있다. 112 신고는 매년 2200~2600만 건으로 데이터량이 많다. 범죄통계는 200~250만 건이다.  


우리 센터는 112 신고와 범죄통계를 활용해서 다음 연도, 다음 달, 다음 날의 사건과 112 신고 발생량을 예측해보았다.  112와 범죄통계를 일단위로 전처리해서 사용했다. 파이썬 시계열 예측 코드에 적용했다. 범죄 발생 통계와 112 신고 전체량을 예측하고, 특징이 보이는 유형을 세부 분석했다.  


최근 3년의 평균과 내년 예측 값을 비교했다. 감소하는 주요 범죄는 강간 강제추행, 폭력, 방화와 같은 강력범죄이다. 강간 강제추행 범죄는 25.9% 감소해서 5,672건 발생을 예측했다. 폭력은 287,272건 발생으로 많지만, 전년보다 40,814건이 줄어들어 12.4%이 감소한 숫자이다. 방화 역시 15.9%(201건) 감소 예측했다.  


증가하는 범죄는 보이스피싱, 선거범죄, 아동학대로 예측했다. 아동학대의 증가폭이 가장 크다. 최근 3년 평균 대비 64% 증가한 8,085건 발생을 예측했다. 보이스피싱은 9,262건 발생하는데 19.8% 증가하는 숫자이다.  선거범죄도 432건으로 35.3% 늘어날 것이다.  


112 신고는 범죄통계와 특성이 달라 긴급성을 가지고 있다. 범죄통계와 같은 항목으로 대비하기 어렵다. 줄어드는 신고유형은 '폭력'이다. 28.7% 줄어든 134,750건으로 예측했다. 절도도 35,933건으로 15.1% 감소 예측했다. 사기 역시 49,248건으로 21.5% 감소할 것이다. 112 신고에서 사기는 주로 무전취식, 무임승차 유형이다. 줄어드는 범죄는 주로 사회적 거리 두기의 영향으로 생각한다.


늘어나는 범죄는 강도 마약과 여성 대상 범죄이다. 112 신고는 신고 유형에서 강도와 마약을 같은 항목으로 분류한다. 버닝 썬 사건 이후 마약 신고가 늘어나고 있다. 2022년에는 강도·마약 신고가 97% 늘어난 3,964건으로 예측했다. 강간, 강제추행, 몰래카메라, 스토킹 등 여성 대상 범죄를 묶어서 분류했는데, 이 유형의 범죄는 26.5% 늘어난 19,853건으로 예상했다.

2021 스마트 치안 연구개발 (김희두, 신상화, 홍세은, 최주현)

데이터가 그 자체로 모든 것을 말해주지 않는다. 시계열 분석 결과를 분석하는 분석관의 식견이 필요하다. 당연한 것은 당연하게, 특이한 것은 특이하게 설명해줘야 한다.  위 그래프를 비롯한 데이터들을 통해 계절적 요인을 파악할 수 있다. 보통 7~9월에는 범죄와 신고가 많고 11월~2월에는 줄어든다. 이는 범죄의 계절적 요인 때문이다. 2019년부터 하반기부터 전체 데이터들이 줄고 있다. 코로나 때문으로 생각한다. 계절성과 전염병의 영향을 받는 것은 범죄도 인간의 행동이기 때문이다. 그러나 이를 설명하는 것이 현장 경찰과 의사결정자들에겐 신선하지 않다. 특이점을 찾아내야 한다.

.

위 증감 유형은 수십 개의 세부 유형 중에서 가장 증감폭이 크고, 착안점이 큰 것이다. 이 유형을 선택해서 그래프를 그리고 최근 2019~2021년의 평균과 2022년의 예측치를 비교했다.  연단위 전국 분석은 데이터의 량이 많아서 비교도 쉽지만 활용 용도는 작다. 월 단위, 일 단위로 시간대를 나누고, 해당 관서를 나눌수록 활용할 주체가 늘어난다. 다만 그만큼 예측의 정확성은 낮아져 어려움이 있다. (다음 편에)


작가의 이전글 1 월 네째주 스마트치안뉴스
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari