brunch

You can make anything
by writing

C.S.Lewis

by 패쓰파인더 May 08. 2022

수사서류 작성 지원 AI 기술

기술 악용 범죄와 경찰대응-6

경찰 수사를 돕는 AI에 대한 상상과 시도들이 있다.

2016~2018년까지는 '빅데이터 기반 범죄대응 플랫폼'(Crime Layout Understanding Engine, 약칭 CLUE)가 있었다.  2020년부터 2024년까지는 <AI 기반 범죄수사 지원 과제>를 진행하고 있다.


개발목표를 설명한 동영상을 보자. 복잡한 수사 과정에서 모은 자료를 시간과 쟁점에 따라 정리하고, 수사경찰이 수사자료 작성할 때 도움을 주게끔 구조를 제시하고 문장을 추천해주는 개념이다.

 

경찰청 AI 수사지원 설명 동영상


이 기술 개발을 위한 단계는 아래 그림과 같다. 수사자료를 작성할 때 사용하는 데이터를 수집해서 텍스트를 정점으로 정리해 시각화해준다. 비슷한 사건을 탐색해서 비교하는 시각화 결과를 보여준다. 수사관이 생각하는 수사의 가설 (범인이다. 아니다. 증거가 충분하다. 아니다 등)을 반론하는 '대립 가설'을 생성해 대조해줌으로서 이를 반론할 수 있는 수정 보완 사항을 제시한다. 

기술 개발 체계

2년차에 접어든 연구팀은 1)사건분류 및 분석 통합시스템 개발 2)텍스트 분석 기반 ‘논증 데이터’추출 및 사건 구조 시각화 기술 개발 3)대립가설 생성 기반 검증대상 사건구조 수정/보완/추천 기술개발에 박차를 가하고 있다. 1) 2)는 2016년 상술한 CLUE 과제를 통해 시도한 바 있다. 3)은 이번 과제의 차별점이다. 아래 그림은 예전 모 의사의 부인 사망 사건에서 부인의 사망원인을 살인인지 아닌지를 판단한 대립 논증 구조이다. 목이 졸려 질식사했다는 주어진 사실에서 목졸림이 원인인가, 누운 자세로 인한 눌림인가를 대조하고 여기에 대한 전문가의 진술과 증빙자료를 대조하며 결과를 내리는 과정을 구조화했다. 이 과정을 컴퓨터가 AI로 자동으로 구조화해서 보여주고, 수사관에게 시각화해서 제시하며 문서 작성에 도움을 주겠다는 것이 취지이다. 

논문 구조 예시

1차년도를 마친 연구팀은 수사자료에 활용할 데이터로 주로 판결문을 참고했다. 법원이 공개한 판결문의 문서 파일(PDF)를 디지털화하고 항목화했다. 판결문의 문서를 구조화해서 컴퓨터가 읽고 해석할 수 있도록 기본 구조를 만든 것이다. 

판결문을 활용한 연구과제 데이터베이스 예시 방식

경찰과 연구자들이 범죄에 대한 문서를 데이터로 해석하려 했던 앞선 시도에서도 도움을 얻고자 노력하고 있다. 2018년 종료한 상술 Clue R&D의 단어사전을 참고해 새로운 범죄단어사전 개발하려 한다. 예전 CLUE에서 '살인 사건'의 경우 유사성 판단하는데 사용한 항목은 범행장소, 관계, 동기, 계획성, 상태/특성, 도구, 살해방법이었다. 그 방식이 이 과제에서도 개선할 시작점이다. 


2차년도 이후 연구는 논증구조를 정교하게 만들어 컴퓨터가 제시할 수 있도록 만드는 것이다. 논증 구조에 어떤 질의 응답을 하는지를 체크리스트로 만들고, 그 근거에서 유형을 정의하며 비슷한 사건에서 도출한 쟁점을 추천하는 절차를 상정하고 있다.

논증구조 자동 추천 제시 개념

이 기술이 실용화하면 수사경찰이 보고서를 작성할 때 컴퓨테와 질의 응답하여 결과보고서를 작성할 수 있다. 수사관이 유사사건에서 쟁점이 된 내용을 질문하면 해당 쟁점과 논증 결과, 반론한 방법을 보여주면 수사경찰이 따라가는 방식이다. 

수사경찰 질의 응답 개념


이 과제의 도전적 목표는 흥미롭다. 법학과 수사전문가들이 과제 기획을 주도하면서 사람이 범죄 수사를 쟁점 도출해 논증하는 과제를 표준화하고 컴퓨터와 협력하는 목표를 추구하고 있다. 가치있는 방법론을 실제 수사사건 서류에 적용하는 연구를 해야 한다. 논증 구조가 비슷하다고 해도, 모든 사실관계를 최대한 규명한 법원의 판결문과 가장 빠른 단계에서 부족한 증거 속에서 결론을 내야 하는 경찰 문서는 차이가 있다. 


논증은 사람들 사이의 대화에서 가장 고차원의 지적 상호작용이다. 제한된 연구기간과 자원, 이제 초창기인 경찰 자연어 분야 R&D 기반에서 AI 논증 추천이 가능하는 것은 매우 도전적이다. 2018년 종료한 CLUE라는=약칭의 R&D, 경찰 수사에 대한 정보화시스템 들이  '유사사건 분류 AI'를 시도하겠다고 자신했지만 아직 실용화하지 못했다. 실제 데이터를 활용하고 수사지식-데이터분석 역량을 모두 갖고 있는 연구자들이 최적의 방법론을 숙고하더라도 목표는 만만치 않다. 


이 과제에서도 실제 데이터 활용은 관건이기에 경찰대학을 매개로 한 개인정보 포함데이터의 비식별화 유통 과정을 제안했다. 경찰대학이 원본 데이터를 모아 비식별화하고 의사결정해서 연구에 활용하기로 했다. 그럼에도 형사사법정보데이터를 활용하지 못하고 있다. 

과제의 수사데이터 활용 방법 

창의적인 목표인 목표와 방법론을 제시해도 그것을 도와줄 실제 업무 환경이 지지부진하면 연구는 힘을 잃는다. 현실의 장애가 없더라도 어려운 것이 치안 분야의 자연어 AI이다. 앞선 182챗봇, 112신고를 비롯해 수사 역시 마찬가지이다. 경찰관은 그 영역을 '직무 유형의 다름'으로 구분하더라도, 컴퓨터에게 사용하는 언어의 폭이 너무너무 넓다. 입력하는 정보의 범위도 넓은데, 그 범위를 통해 해석하고 추천해야 하는 정답의 영역도 아주 넓다. 사람에도 정돈하지 않은 영역을 기계가 자동적으로 추천해줄 수 없다. 


현재의 치안 자연어 AI R&D는 모두 실제 데이터를 활용하지 못하고 있다. 112, 민원, 수사 영역별으로 나눠서 연구를 시작했지만, 내용의 범주는 너무 넓어 연구 산출물의 효과를 정의하기 어렵다.  연구자는 주어진 방법론을 정립해야 하기에 몇 가지 한정된 주제로 목표 분야를 한정한다. 대부분 3~5종의 시나리오를 추천한다.

 몇 종의 시나리오에서만 효과를 증명한 R&D는 실용화하기 어렵다. 같은 방법론이 모든 시나리오에 적용할 수 없는 건 분명하다. 만든 방법론에 시나리오를 넓히는 방법으로 해결되지 않고 새로운 방법론을 만들어야 할 수 있다.


그런 숙제를 생각하면 R&D를 하는게 소용없는 것이 아닌가? 반론할 수 있다. 그게 R&D의 역할이다. 시행착오를 최소화하고 다음 연구를 위한 출발점을 제시한 것이다. 경찰 R&D는 그래서 아직 시작이다. 앞서 설명한 여러 연구개발의 청사진은 경찰이 이것을 이해하고 개선해서 받아들일 능력이 있을 때야 가능하다.

작가의 이전글 112 신고 대응을 위한 AI 개발
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari