brunch

You can make anything
by writing

C.S.Lewis

by 패쓰파인더 Jan 22. 2022

범인을 찾고 싶다

단서 데이터를 조회하는 데이터 기술

수사는 범죄를 저지른 사람이 누구인지를 찾고, 범죄의 증거를 통해 범죄행동을 재구성하는 과정이다. 수사관은 현장에 남아있는 지문, 족적, dna, 인근에서 찍힌 cctv 영상 피해자가 알고 있는 범인의 인상착의, 전화번호, id, 이메일 등으로 사람을 찾아간다. 살인 성범죄와 같은 강력범죄는 범죄현장의 증거가 중요하다. 사기, 인터넷 범죄들은 계좌, 전화번호, id 등 거래와 접속의 정보들을 사용한다. 수사 단계는 보통 '범인이 누구인지를 찾는 과정', '범인을 잡는 과정', 증거로 입증하는 과정'이다. '누구인지'를 찾기만 해도 반은 끝났다고 말한다. 형사들은 "인적사항 나왔나? 그럼 끝났네"라고 말한다.

.

인터넷 사기, 전화사기, 해킹 등 온라인 범죄가 늘고 있다. 오프라인에서 강절도 하던 범죄꾼들이 온라인으로 옮겨가는 것이다. 이런 범죄는 범인이 누구인지 찾는 게 어렵다. 범인들은 온라인 속에 숨는데 경찰은 그렇게 못할까? 경찰도 상상력을 발휘하고 있다. 그동안 입력한 정보 속에서 단서를 찾아내려는 시도를 하고 있다.

.

제일 오래된 정보 검색은 범죄경력조회이다. 형의 실효 등에 관한 법률에 따라 수사를 위해 필요한 경우, 대상자의 이름과 주민번호로 해당하는 사람이 전과가 있는지, 수사를 받은 경력이 있는지 찾는다. 동종 전과가 있다면 좀 더 범인일 개연성이 높다고 생각한다.  통화한 전화번호만 알고 있다면 그 번호의 가입자가 누구인지 통신자료 조회를 한다. 각종 포털의 id, 이메일 주소도 가입 명의자를 알아내기 위해 통신자료 조회를 한다. 이렇게 찾아낸 전화번호 명의자와 id, 이메일이 범인의 실제 명의일 경우는 거의 없다. 그다음 단계는 이 번호와 id로 이뤄진 통화내역과 거래 정보를 알아내려 한다. 이 단계는 법원의 통신사실 확인 압수수색영장이 필요하다. 영장을 제시하여 통신사실을 확인해서 전화의 수신과 발신, id의 로그기록 등 비 내용적 정보를 확인할 수 있다. 내용의 정보는 통신제한 조치(감청)의 영장이 필요하지만, 법원의 발급도 엄격하고 일부 플랫폼 사업자는 응하지 않는 경우도 있다. 이렇게 단계를 진행하지만, 어느 시점이 되면 단서가 끊기고 한다.

.

인터넷에서 정보를 검색하듯, 경찰도 그간 입력한 정보들 속에서 검색할 수 없을까? 당연한 관심사이다. 전화번호, 계좌번호, id, ip들을 경찰 정보망에서 찾아낼 수 없을까? 이런 시도를 하고 있지만 상상만큼 효과를 내지는 못하고 있다. 검색을 잘하려면 찾으려는 정보들을 미리 '정형 데이터'로 입력해야 한다. 경찰들이 형사사법 전산망에 사건을 입력할 때 이름과 주민번호 등 범인과 피해자의 주요 정보는 정형 데이터로 입력하지만, 더 많은 정보들을 한글 문서로 첨부하고, 혹은 비정형의 문장으로 입력한다. 비정형 데이터에서 '전화번호', '계좌번호', 'ID', 사람의 이름, 사칭한 이름, 범행도구의 명칭 등 여러 정보를 찾는 것은 만만치 않다.

.

찾으려는 단어, 정보의 패턴을 컴퓨터가 미리 학습하고 있어야 한다. 경찰이 머릿속으로 미리 알고 있는 단어들을 컴퓨터도 가지고 있어야 한다. 이를 '용어 사전'이라고 말한다. 실제 우리 센터에서 '전화 사기범들이 저지른 비슷한 범죄들을 찾아달라'는 요청을 지원했다. 이 과정에서 예를 들어 '농협 계좌로 돈을 받았다'라는 단서로 비슷한 사건을 찾아내고자 '농협'이라는 키워드로 그간 10년간 수사 데이터를 검색했다. 농협으로 돈을 받은 모든 사건을 찾아내지 못하고 상당수가 빠졌다. 눈으로 확인해보니, 수사경찰들이 수사 전산시스템에 입력한 내용들이 '농협 중앙회', '농업협동조합', 'NH농협'등 다양했다. 이 경험으로 우리 센터는 농협, 농협중앙회, 농업협동조합, NH 농협 등이 같은 의미라는 사전을 만들었다. 

전화사기 사건 찾아내기 : '웰컴투 저축은행'이 등장한 사건 30건 찾아냄 (2019년 스마트치안 연구)

.

컴퓨터 자원도 많이 필요하다. 현재 경찰청의 정보시스템은 업무과정을 전산화하기 위해 만들었고, 정보를 찾기 위한 목적은 우선순위가 아니다. 업무처리용 시스템 전체에서 정보를 찾아내려면 부하가 걸린다. 정보 검색을 위한 시스템은 별도로 만드는 게 낫다. 몇 년 전까진 경찰들이 이름과 같은 키워드를 수사시스템에서 검색할 수 있었다. 점차 사용이 많아지면서 시스템 부하가 많아지자 검색을 막았다. 2020년 수사시스템 운영 부서는 현장 직원들의 요청을 받아서 원하는 정보를 검색해 제공해주는 서비스를 운영했다. 사람에게 요청하고 다시 사람에게 회신해주는 절차를 전산화할 수 있다면 좋을 것이다.  

.

빠른 분석할 수 있도록 한 것은 112 신고, 수사 데이터, 민간 데이터를 모아서 분석용 데이터베이스를 따로 만들었기 때문이다. 업무관리시스템을 운영하는 부서들은 모은 데이터를 분석하는 시스템으로 발견시키고 싶지만 분석을 위한 데이터 베이스와 업무관리를 위한 데이터베이스는 다르다는 것을 알아가고 있다. 

.

우리 센터에서도 그런 과정을 거쳤다. 2020년부터 전화사기를 수사하는 수사관들이 필요한 정보를 제공했다. 수사관들이 범인을 잡고 나서 이 범인들이 과거에 저지른 사건을 찾아달라고 요청했다. 범인들이 사용한 계좌번호, 전화번호, 사칭한 사람과 기관의 이름을 과거 수사시스템의 저장 정보에서 찾아내서 알려주었다. 그 과정에서 '단어 사전'등 분석 기법을 키웠고, 2021년 정보화 시스템을 개발했다. 현장 수사관들이 직접 접속해서 찾고자 하는 정보를 찾을 수 있게 된 것이다.  전화사기 수사지원시스템(KONAN, 코난)은 우리 센터에서 정보분석 시스템으로 처음 세상에 선보이는 산출물이다. 

.


작가의 이전글 1월 셋째 주 스마트 치안 뉴스
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari