brunch

You can make anything
by writing

C.S.Lewis

by 삼인분공부 Oct 23. 2020

대량살상 수학무기_알고리즘은 인간의 편견을 반영한다

2014년 사물인터넷(Internet of Things)을 다룬 <네이키드 퓨처>라는 번역서를 출간한 적이 있다. 책 내용에 따르면 사물인터넷 세상은 커다란 가능성과 풍요를 약속하지만 한편으론 영화 <마이너리티 리포트>처럼 일상생활이 모두 노출되고 빅데이터를 분석한 예측 프로그램에 의해 모든 이들이 통제당할 수도 있다. 나에겐 참 재미있고 유익한 책이었지만, 지금 생각해 보면 사물인터넷이라는 개념 자체가 생소했던 시기에 사물인터넷의 기회와 위협이라는 주제가 대중적으로 큰 호응을 얻기는 어려웠던 것 같다. 당연히 많이 팔리지는 않았다. 

     

사물인터넷을 얘기하려면 빅데이터를 먼저 얘기해야 한다. 인터넷에는 어마어마한 데이터가 시시각각 쌓여가고 이런 데이터를 잘 활용하는 기업은 순식간에 시장의 판도를 바꾼다. 수많은 회원과 데이터를 가진 기업은 전혀 다른 업종에 진출해도 금세 시장을 평정한다. 네이버가 쇼핑 강자가 되고 카카오가 금융 강자가 되었다. 테슬라의 주가가 그토록 많이 오른 것은 전기 자동차를 만들어서가 아니라 운전자들의 주행 기록 데이터를 끝없이 쌓아 그 데이터를 다른 사업들에도 다양하게 응용할 수 있는 데이터 플랫폼 기업이기 때문이다. 

     

가전제품이나 일상 공간 곳곳에 센서를 부착하여 인터넷에 연결하는 사물인터넷은 사람들이 PC나 모바일로 일부러 인터넷에 접속할 때 발생하는 데이터를 훨씬 뛰어넘는 어마어마한 데이터를 생산한다. 그야말로 빅빅빅데이터가 생성되는 것이다.

     

빅데이터는 거대한 데이터 덩어리일 뿐이다. 이것을 특정 목적에 활용하려면 일정한 패턴을 추출하는 알고리즘(특정 문제를 해결하기 위해 프로그래밍 언어를 사용해 만든 일련의 절차)이 필요하다.

      

2016년 나는 <대량살상 수학무기 Weapons of Math Destruction> 원서를 검토하고 매료될 수밖에 없었다. 이 제목은 대량살상무기(Weapons of Mass Destruction, WMD)에서 ‘mass’를 ‘math’로 바꾼 신조어다. WMD는 부시 행정부가 이라크에 대량살상무기가 있다며 쳐들어갔다가 찾지 못했던 역사 때문에 아주 유명해진 단어이다. 이 어이없는 사건은 오락영화인 <페르시아의 왕자>에서 패러디 대상이 되기도 했다.

     

이 책의 내용에 따르면 <마이너리티 리포트>의 세상처럼 범죄 예측, 인사 평가 등에 이미 빅데이터 기반 알고리즘이 다양하게 활용되고 있었다. 명문대 종신교수직을 내던지고 퀀트(수학에 기반한 금융 분석가)와 데이터과학자로 활약했던 수학자 캐시 오닐이 쓴 일종의 내부고발 성격의 책으로, 금융계와 IT업계가 개발한 빅데이터 알고리즘들이 얼마나 사회 각 분야를 빠르게 장악해 가고 있는지, 민주주의를 얼마나 위협하는지 분석하고 폭로한 문제작이었다. 영미권 도서들은 현지에서 출간되기 전에 제안서(proposals) 상태로 검토하는 경우가 많지만, 이 책은 이미 출간되어 엄청난 호평을 받고 내셔널 북어워드 논픽션 분문 후보에 오른 상태였다.

      

저자의 권위와 전문성, 도서의 화제성과 작품성은 이미 검증된 책이었지만, 이 책의 계약에는 우려의 목소리가 컸다. 좋은 책이지만, 소수의 지식인들만 볼 만한 책이라는 것이다. 하지만 나는 예전의 <네이키드 퓨처>와는 달리 이 책은 수만 부 판매까지 기대할 수 있다고 생각했다. <네이키드 퓨처>도 수천 부는 팔렸다. 업계 관계자나 관심이 깊은 사람들 위주로 판매된 것 같다. 그러나 <대량살상 수학무기>는 저자의 명성과 도서의 화제성에서 훨씬 더 압도적이었다. <네이키드 퓨처>는 프로포절 상태에서 계약한 책인데, 막상 출간된 후 미국에서도 판매가 높지 않았다. 하지만 <대량살상 수학무기>는 이미 미국에서 작품성과 흥행성이 입증된 책이었다.

     

또한 2014년과 2016년의 차이는 컸다. 2014년에는 빅데이터를 비롯한 새로운 디지털화의 물결에 일반인들의 이해나 관심도가 높지 않았다. 그런데 2016년에는 인공지능(알파고)이 바둑기사와의 대결에서 승리함으로써 갑자기 빅데이터, 인공지능, 딥러닝(컴퓨터가 사람처럼 학습하도록 하는 기술) 등이 대중의 관심사로 급부상했다. 이러한 변화들을 한데 묶어 ‘4차 산업혁명’이라고 부르자, ‘이제 정말 새로운 세상이 오나 보다’라는 기대와 불안이 급속도로 퍼져나갔다.

      

책이 많이 팔리는 데는 화제성도 중요하지만, 개인들의 이해관계와 얼마나 밀접한가와도 관계가 깊다. 사회정치 분야에서는 일반적으로 대중적인 베스트셀러가 나오기 어려운데, 사람들이 관심이 없어서가 아니라 개인적 이해관계와 밀접하지 않기 때문에 책을 잘 안 사고 인터넷에서만 요란하게 관심을 표명하기 때문이다. <대량살상 수학무기>가 우리나라에서 별로 많이 안 팔릴 거라고 생각한 사람들은 지식인들이나 돈 주고 사서 볼 만한 책이지 일반인들의 이해관계와는 밀접하지 않다고 판단한 것이다.

      

하지만 내 생각은 달랐다. 각 기관과 기업에서 채용이나 인사 평가와 관련된 일을 하는 사람들만도 엄청나게 많다. 교사나 공무원들처럼 공공 영역에서 일하는 사람들을 어떻게 평가할 것인지는 늘 논란거리다. 법원의 양형 기준, 재범 예측, 보험 가입자 심사, 대출 심사, 입시 서류전형 등 알고리즘이 적용되거나 적용될 만한 부분은 무궁무진하며, 그에 따라 이해관계가 좌우되는 사람들도 무수히 많다. 빅데이터 알고리즘을 마케팅에 응용하고 싶어 하는 사람들도 아주 많다. 이런 일에 관여하거나 이해관계가 밀접한 사람들은 소위 말하는 고급인력이나 관리자 직급의 사람들이 많고, 이들은 독서율도 매우 높다. 우리나라 사람들은 공정성 문제에 아주 예민하기 때문에 사람보다 알고리즘이 더 공정할 것이라고 기대할 수도 있고, 그래서 더욱 더 알고리즘이 실제 현실에서 어떻게 작동하는지 알아야 한다.

      

다른 출판사들도 지식인용 책이라고 여겼는지 책의 파괴력에 비해 선인세 수준이 높지 않았다. 나는 사람들을 설득해서 승인을 받은 후, <네이키드 퓨처>보다도 수천 달러 낮은 금액에 <대량살상 수학무기>를 계약하는 데 성공했다. 그후 이 책은 내셔널 북어워드에 선정됐고, 당시 국내에서 가장 각광받던 지식인인 ‘유발 하라리’도 이 책을 강력 추천해서 화제가 되었다. 그런데도 번역서 출간 직전까지도 사내 여러 인사가 판매가 높지 않을 것 같다고 우려했다. 다행히 뚜껑을 열고 나자 바로 상황이 달라졌다. 언론과 인터넷 서점 MD들은 물론 독자들도 이 책을 주목했다. 이 책은 내가 기대한 대로 수만 부 이상의 판매를 기록했다.

     

“쓰레기를 넣으면 쓰레기가 나온다”

     

사람을 배제한 교사 평가 알고리즘이 학생들과 학부모들이 열렬하게 지지하는 헌신적인 교사를 학교에서 퇴출시킨다. 대출 신청자들의 맞춤법이 얼마나 정확한가를 이자율 산정 알고리즘에 반영해서 저학력자와 이민자에게 높은 대출 이자를 부과하고, 고객 수 예측 프로그램으로 서비스 담당 직원의 업무시간을 수시로 조정함으로써 직원들이 다음날 몇 시간 동안 근무할지, 다음 주에 어느 요일에 근무할지 미리 알 수 없는 항시 대기 상태로 만드는 영리 기업들의 행태는 취약한 사람들이 대출을 얻어 사업을 하거나, 근무시간 전후에 공부를 하거나 기술을 익힐 기회를 빼앗는다.

      

이 책에서 인상적인 내용 중 하나는 미국 영리 대학들의 ‘약탈적 광고’였다. 오직 돈벌이만 추구하는 교육 내용이 부실한 영리 대학들은 취약계층의 청년들에게 맞춤형 광고를 발송해 대학 졸업장이 있어야 좋은 직장을 얻고 연봉을 높일 수 있다고 유혹해서 대학에 등록하게 한다고 한다. 복지 대상자, 약물중독 재활치료 중인 사람, 미혼모, 최근 이혼(사별)한 사람, 학대 피해자, 자존감이 낮은 사람, 저임금 노동자에게 맞춘 이런 광고에 넘어가 수많은 사람들이 제대로 된 교육을 못 받으면서 막대한 학자금 융자로 빚더미 위에 올라 있다는 것이다. 우리나라에서도 학원이나 소비재 기업 등에서 얼마든지 응용할 수 있는 광고 기법인 것 같다. 영업 비밀은 반드시 지켜야겠지만.

     

알고리즘은 인간의 나쁜 의도가 개입되지 않더라도 데이터 자체가 지닌 불평등을 반영한다. 쓰레기를 넣으면 쓰레기가 나오는 법이다. 어린 자녀를 둔 한부모 가정 부모는 아이를 돌보느라 지각과 조퇴가 잦을 수 있다. 외국에서 온 입학생들은 다른 문화에 적응하기 어려워 졸업률이 낮을 수 있다. 어떤 조건의 사람들이 성실한 직원이 되는지, 어떤 입학생 집단의 졸업률이 높은지 단순히 과거의 데이터를 바탕으로 추정해 내면 불평등한 현실을 그대로 반영한 결과가 나오게 된다. 죄수의 거주지, 가족 구성, 학력과 경력 등을 바탕으로 재범률을 추정하면 슬럼가 출신 흑인은 재범률이 높으므로 최대한 오랫동안 감옥에 가두어야 한다는 결론이 나온다. 범죄율이 높은 지역을 집중적으로 순찰하면 자잘한 범죄들까지 속속들이 밝혀내어 더 많은 전과자를 양산한다. 그 지역은 우범지역으로 낙인찍혀 더욱 더 경찰의 표적이 되고, 전과자 꼬리표를 단 사람들은 정상적인 직업을 갖기 어려워 더욱 더 범죄의 유혹에 약해진다. 현실을 고려하지 않고 알고리즘을 적용하면 이렇듯 운 나쁜 사람들을 계속 불운 속에서 허우적거리도록 악순환에 빠뜨린다.

     

오직 인간만이 시스템에 공정성을 주입할 수 있다. 한부모 가정을 차별할 게 아니라 돌봄 서비스를 제공하고, 외국 학생들을 위한 언어 교육과 문화 교류 프로그램을 운영하고, 불우한 처지의 죄수들에게 체계적인 직업 훈련을 실시함으로써 불평등한 조건 자체를 시정하는 것이 바로 인공지능이 할 수 없는, 인간의 영역, 정치의 영역이다.                               

매거진의 이전글 경제경영책 만드는 법 – 편집자에서 저자로
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari