Artificial Intelligence and Law Story
인공지능을 활용한 국내 리걸테크 시장의 성장
국내의 리걸테크(Legal Tech) 시장의 성장은 우리가 생각한 것보다 빠르게 성장하고 있다. 그렇다면, 많은 사람들이 궁금해하는 인공지능 판사 그리고 인공지능 변호사라는 것이 정말 가능한 것일까?
아마 이 글을 읽고 있는 대부분의 독자분들께서는 "인공지능판사? 아주 먼 미래 이야기지" 라고 생각하실지도 모르겠다. 하지만 놀랍게도, 최근 인공지능을 인간 판사가 내리는 판결에 도움을 줄 수 있는 방향으로 적극적으로 추진하고 있는 국가들이 있다.
앞으로 소개하는 내용 중에 나오는 기계학습(인공지능이라 불리고 있는)의 개념이나, 알고리즘 같은 경우 개념이 익숙치 않은 독자분들을 위해 본 글에서는 아주 간단하게 설명을 하고 넘어가고, 추후에는 따로 개념을 설명을 하는 글을 연재하도록 하겠다.
(현재 기계학습이나 데이터사이언스의 개념에관한 쉽고 자세한 설명은 인터넷이나 유튜브등 다양한 매체를 통해 접할 수 있다. 하지만, 법률 인공지능과 관련되어있는 기계학습 개념을 무척 쉽고 재미있게 설명한 책은 #1 인공지능과 법 - 인공지능의 역사편에서 언급했듯이, 국내 법률 인공지능 전문 기업 인텔리콘 연구소의 대표이사 임영익씨의 저서 '프레디쿠스(PREDICUS)'를 참고하면 많은 도움이 될 것이라 생각한다. 앞으로 개념을 이해하는데 있어서 유용한 웹사이트들이 있으면 참고자료에 링크를 걸어놓도록 하겠다.)
그럼, 인공지능 판사와 관련해서 각 국가별로 어떤 시도들이 진행되고 있으며, 어떤 흐름으로 가고 있을까?
결론부터 말하면, 현재 인공지능은 판사의 역할을 대신할 정도로 큰 영향력을 미치고 있지는 않다. 하지만, 앞으로 인공지능 판사의 등장 가능성을 보여주는 몇가지 사례가 있다.
2014년, 대니얼 마틴 카츠(Daniel Martin Katz)는 1816년부터 2015년의 미국연방대법원 28,000개의 판례를 앙상블 모델(Random Forest, 기계학습 알고리즘 종류 중에 하나이며 하나의 의사결정나무 알고리즘이 아닌 여러개의 의사결정나무를 앙상블하여 더 정확성을 높일 수 있는 알고리즘이다.)을 사용하여 미국 연방 대법원의 재판 예측을 하는 모델을 만들었고 결과는 놀랍게도 70.2% 의 정확성을 선보였다.
의사결정나무라는 것은 쉽게 말해서, 밑의 그림과 같이 분리를 반복하여 변수를 구분하는 영역을 만드는 알고리즘이다.
이렇게 단순해보이는 알고리즘으로 어떻게 예측을 할 수 있는지 궁금해하실 수도 있으실 것 같아서, 어려운 용어를 다 제외하고 아래와 같이 아주 간단한 예시를 만들어 보았다. (의사결정나무의 단골 예시이다)
EXAMPLE: 은행에서 돈을 빌려줄 때, 아무나 빌려주지 않는다. 파산 가능성이 높은 사람에게 빌려주면 은행은 손해이기 때문이다. 이 때, 은행은 의사결정나무를 통해 돈을 빌리러 오는 사람이 파산할 가능성이 높은지, 낮은지 예측해 볼 수 있다.
위 그림과 같이, 그동안 은행에 돈을 빌리러 왔던 사람의 데이터를 활용해 수입의 범위, 범죄의 유무, 현재의 직업, 결혼 여부, 연체를 한적이 있는지 등등 각각의 변수를 설정하여 그동안 은행에서 돈을 빌렸던 사람 중에 파산해왔던 사람은 어떤 범주에 속해왔는지 의사결정나무모델을 학습시킬 수 있고, 이 모델의 학습을 기반으로 앞으로 돈을 빌리러 온 새로운 사람의 조건들을 넣어보고 과연 이 사람이 파산할 것인지, 아닌지를 예측해 볼 수 있는 것이다. (여기서 자세히 들어가면, 비용함수, 즉 불순도 측정이라던지, 어떤 변수가 중요한 변수인지, 과적합 문제 등등 설명할 것이 너무 많아지므로 생략하도록 하겠다. 여기서는 의사결정나무의 컨셉만 이해해도 좋다!)
결론적으로, 대니얼 마틴 카츠씨는 이렇게 아주 단순한 알고리즘(앙상블 모델은 위와 같은 한개의 의사결정나무를 여러개 모아서 사용한 알고리즘이라고 이해해도 좋다)을 사용하여 70%나 되는 정확성을 선보였다는 것이 놀랍지 않은가?
(어떤 구체적인 원리로 대니얼 마틴 카츠가 이 모델을 만들었는지 너무 궁금하신 독자분들은 링크를 누르시면 그가 쓴 논문을 확인하실 수 있습니다.)
그렇다면, 미국 법원에서는 이러한 인공지능 알고리즘 등이 실제로 쓰이고 있을까?
현재, 미국 형사 재판 시스템에서는 상습적인 범행(Recidivism)의 위험을 측정하는 알고리즘이 널리 사용되고 있다고 한다. 이 알고리즘은 주로 a. 피고인이 재판 전에 다시 범행을 행할 가능성과(the likelihood that the defendant will re-offend before trial (“recidivism risk”)) b. 피고인이 재판에 나오지 않을 가능성(the likelihood the defendant will fail to appear at trial (“FTA”))을 추정한다.
그렇다면, 이 알고리즘을 미국 법원은 구체적으로 어떻게 활용하고 있을까?
바로, 판사들이 형량을 결정하는 양형을 판단하는데 있어서 활용을 하고 있다. 사실, 그동안 어떤 사람의 어떤 행동이(범죄에 해당하는) 데이터화 되어서 이런 알고리즘에 의해 앞으로의 행동에 대한 예측을 구체적인 가능성으로 나타내주고, 그것을 판사들이 형을 결정하는데 있어서 활용한다는 사실은 조금 무서운 이야기이기도하다.
문득, 과거에 재미있게 보았던 스티븐 스필버그의 마이너리티 리포트(미래의 범죄를 예측하여 처벌하는...)가 생각난다. 안보신 분들은 꼭 보시기를!!! 추천드린다!!!
본론으로 돌아가서, 이러한 알고리즘은 개개인의 나이, 성별, 주소, 가족관계, 환경, 고용상태 등등을 고려요소(Factors)로 판단한다. 이런 예측 알고리즘은 현재 많은 비판을 받고 있는 것도 사실이지만, 이런 기술들을 적극적으로 도입하고, 실제 미국 법조계에서 이런 도구를 활용한다는 것은 시사하는 바가 많다고 할 수 있다.
Risk Assessment 로 사용되고 있는 "COMPAS" 의 고려요소 질문목록들
미국과는 전혀 다른 모습을 보여주고 있는 나라를 소개하겠다. 바로, 프랑스다.
프랑스는 인공지능을 법조계에 도입하는것에 아주 꺼리고 있는 나라중에 하나다. 현재 프랑스는 판사들의 판례를 앞서 소개했던 대니얼 마틴 카츠처럼 분석하거나 법원의 판례 정보를 데이터화시켜서 법원의 판단을 예측하는 행위를 할 경우, 5년 이하의 징역에 처해질 수 있다.
("The new Article 33 of the Justice Reform Act reads: “No personally identifiable data concerning judges or court clerks may be subject to any reuse with the purpose or result of evaluating, analyzing or predicting their actual or supposed professional practices. “The violation of this law shall be punished by the measures outlined in articles 226-18, 226-24, and 226-31 of the penal code, without prejudice of the measures and sanctions provided for under the law 78-17 of 6 January 1978 concerning data processing, files and freedoms”, Translated by Rebecca Loescher, a professor of French at St. Edward’s University at the Angers, France campus)
네덜란드는 E-Court 라는 것을 2010년 1월 11일에 도입했다. 네덜란드의 E-Court는 채권추심(Debt Collection)과 같은 한정적인 분야에 AI가 활용될 수 있도록 모델링이 되어있다고 한다. 예를 들어, 앞서 의사결정나무 은행 예시로 살펴보았던 것처럼 어떤 중요한 변수들(Essential key parameters)이 만족되면 결과값을 주는 식으로 활용이 되는 것이다.
현재 법원 소송에서 디지털화된 판결이라는 논문(Digitally Produced Judgements in Modern Court Proceedings)에 따르면, 소송의 규모부터 시작해서 다양한 변수들이 고려되어진다고 한다. 하지만 네덜란드 정부가 아주 제한적으로 사용할 수 있게끔 해놓아서, 아직은 사람의 개입이 많이 필요한 실정이라고 한다.
여기에 소개하지 않는 해외의 여러 국가들이 지금도 끊임없이 인공지능을 법과 연결시켜서 활용하고 있으며, 법과 인공지능의 긴밀함은 앞으로 시간이 갈수록 더 깊어질 것이다.
지난 글에서, 인공지능에 관한 테크니컬한 부분을 기본부터 조금 심화된 내용까지 다루려고 생각을 했지만, 법과 인공지능에 관한 동향과 소식 그리고, 이슈들을 이렇게 천천히 살펴보면서 추후에 다루는 것도 좋을 것 같다라는 생각이 든다.
<참고 문헌 및 자료>
-<프레디쿠스> (임영익)
- https://epic.org/algorithmic-transparency/crim-justice/
-"Can AI Be a Fair Judge in Court? Estonia Thinks So." www.wired.com. last modified n.d., accessed Dec 13.2019, https://www.wired.com/story/can-ai-be-fair-judge-court-estonia-thinks-so/.
-Daniel Martin Katz, Michael J. Bommarito II, Josh Blackman, A general approach for predicting the behavior of the Supreme Court of the United States. 12 April 2017., PLoS ONE 12 (4): e0174698. (https://doi.org/10.1371/journal.pone.0174698)
-Henriette Nakad-Westrate, Ton Jongbloed, Jaap van den Herik, Abdel-Badeeh M. Salem, „Digitally Produced Judgements in Modern Court Proceedings”, (International Journal of Digital Society, Colume 6 Issue 4, December 2015), p.1102.
-"France Kicks Data Scientists Out of Its Courts." https://slate.com/technology/. last modified n.d., accessed Dec 13.2019, https://slate.com/technology/2019/06/france-has-banned-judicial-analytics-to-analyze-the-courts.html
-"The Misuse of Big Data Algorithms in the United States Criminal Justice System." https://towardsdatascience.com/. last modified n.d., accessed Dec 13.2019, https://towardsdatascience.com/https-medium-com-mfingerhood-the-misuse-of-big-data-algorithms-in-the-united-states-criminal-justice-system-e9053d947aa
-"Can you make AI fairer than a judge? Play our courtroom algorithm game," https://www.technologyreview.com, last modified n.d., accessed Dec 13.2019, https://www.technologyreview.com/s/613508/ai-fairer-than-judge-criminal-risk-assessment-algorithm