대량살상 수학무기
어느새 부턴가 빅데이터란 단어가 풍년이다. 뭐 이해 못하는 바는 아니다. 당신이 무얼하건 거기에 빅데이터란 단어를 끼얹으면 굉장히 섹시하게 들린다. 뭔가 되게 과학적인것 같고 대단히 체계적인 무언가를 하는 것 같단 생각이 들게 된다. 원래 내용물이 다르지 않아도 이름이 멋있으면 절반 이상 가는 법이다.
그러나 이름이 멋있다고 내용물도 멋있는 것은 아니다.빅데이터는 그저 데이터일 뿐이다. 빅데이터는 갑자기 인간에게 없던 통찰을 내려주는 그리스-로마 신화의 신탁 같은 것도 아니요 문제 해결의 답을 내려주는 전지한 존재도 아니다.
기초 통계학을 배울때 강조하는 것 중의 하나가 바로 GIGO(Garbage In Garbage Out)이다. 알고리즘을 수학적으로 정교하게 짜둬도 그 알고리즘에 투입하는 데이터가 쓰레기라면 결과 또한 쓰레기일 수 밖에 없단 얘기다. 우리가 빅데이터라 부르는 것 또한 마찬가지다.
빅데이터는 생각이란 것을 하지 않는다.인간이 짜둔 알고리듬(알고리즘)에 따라서 데이터를 수집하고 활용할 뿐이다. 따라서 빅데이터는 인간이 저지르는 실수와 편견, 편향성 또한 고스란히 담고 있다.빅데이터의 데이터 자체가 편견과 편향성이 녹아있는 데이터인 경우도 너무나 흔하다. 더 큰 문제는 그 알고리즘 자체가 편견과 편향성을 반영하고 있는 경우다. 이 경우는 뭘 넣어도 제대로 된 결과가 나올래야 나올 수가 없다.
오늘 이야기할 캐시 오닐의 [대량살상 수학무기]는 바로 이런 빅데이터와 알고리즘의 문제점과 취약점을 설명하는 책이다.
캐시 오닐이 [대량살상 수학무기]를 통해 빅데이터와 알고리즘의 문제로 지적한 것 중의 하나가 알고리즘을 활용하는 목적에 걸맞는 자료가 잘 없다는 점이다. 예를 들어 타자의 타율은 타자의 타격 능력을 확인할 수 있는 직접적이고 강력한 데이터다.
하지만 알고리즘으로 측정하고자 하는 것이 '교육의 우수성'이라면 어떨까? 교육의 우수성을 나타낼 수 있는 직접적인 데이터는 존재하지 않는다. 따라서 교육의 우수성과 상광관계가 높은 것으로 여겨지는 데이터를 활용할 수 밖에 없다. 그리고 그 데이터가 한두가지가 아니라 여러가지이므로 각각의 가중치를 적용해야 한다. 하지만 이 가중치는 어떤 특별한 근거로 정한 것이 아니라 임의의 가중치일 뿐이다. 이 때문에 이렇게 만든 알고리즘을 통해 측정한 '교육의 우수성'은 교육의 우수성을 나타내는 것이 아니라 교육의 우수성을 나타내는 것처럼 보이는 것 뿐이다.
이걸 정확하게 활용한 곳이 바로 US 뉴스다. US 뉴스는 1983년부터 미국의 대학들을 대상으로 교육의 우수성을 평가하고 그 랭킹을 매겨왔다. US뉴스 대학순위가 바로 그것이다. US뉴스 대학순위는 그야말로 빅히트를 해서 모든 대학들이 이 대학순위에서 상위권에 들고자 목을 매달기 시작했다. 이 대학 순위를 끌어올리는 방법은 US뉴스가 정한 15개의 평가지표에서 좋은 성적을 거두면 되는 것이다. 하지만 이는 교육의 우수성이 아니라 우수성과 상관관계가 있다고 여겨지는 임의의 항목들일 뿐이다. 이 항목에서 개선이 이루어진다 해서 교육이 더 우수해지는 것은 아니다. 이는 엄연히상관관계와 인과관계의 오류다.
더군다나 US 뉴스가 선정한 15개 항목을 통한 평가가 교육의 우수성을 드러낸다는 근거는 어디도 없다. 만약 이 선정을 통한 평가에서 하버드, 예일, 스탠포드 같은 전통의 명문들이 낮은 순위를 기록하고 들어보지 못한 대학이 높은 순위를 기록한다면 우리는 분명 '평가가 잘못되었다'라고 여기고 전통의 명문대들이 높은 순위가 나오도록 가중치와 항목을 조정할 것이다. 이는 교육의 우수성을 지표화 하는 것이 아니라 그저 우리가 기존에 가지고 있던 대학에 대한 이미지를 순위화한 것이다. 이는 빅데이터와 알고리즘이 인간이 가진 편견과 차별을 내재화 하는 경로이기도 하다.
그나마 US 뉴스의 대학순위는 평가 항목이 공개되어있기라도 하다. 수많은 빅데이터와 알고리즘들은 그 평가 방식이 영업 기밀로 분류되어 비공개로 운영되고 있다. 즉, 어떤 데이터를 바탕으로 어떻게 활용하여 분석하고 평가를 내리는지를 알 수 없다. 이런 블랙박스 방식의 모델이 가지는 문제점은 어떤 방식으로 평가를 내리는지 알 수 없기 때문에 제대로 된 피드백을 통해 현실 반영 능력이 개선되는 것이 아니라 자기 강화로 인한 왜곡이 이뤄지기 쉽다는 것이다.
[대량살상 수학무기]가 가장 크게 비판하는 지점이 이것이다. 수많은 알고리즘들이 다양한 분야에서 측정과 평가를 하는데 대부분의 모델이 블랙박스처럼 비공개로 되어 있기에 알고리즘 자체에 내재된 편견과 왜곡이 사람들을 배제한다는 이야기다. 그리고 이 배제는 또 다른 배제를 낳는 음의 피드백을 낳는 다는 것이 이 책의 주장이다.
빅데이터와 알고리즘을 통한 개인에 대한 평가는 과거 리뷰했었던 [평균의 종말]과도 맞닿는 부분이 있다. 평균은 집단적 특성을 이해하는데 큰 도움을 주지만 그것으로 개인의 행동과 특성을 예측하는 것은 불가능하다. 개인과 집단의 평균은 완전히 다르기 때문이다. 그래서 [평균의 종말]이 '개개인성'을 주장한 것처럼 [대량살상 수학무기]도 '나의 이력에 의한 데이터와 평가'가 필요하다고 이야기한다.
아울러 이 블랙박스 같은 모델이 편견과 차별을 강화하기 때문에 캐시 오닐은 민주주의와 시민의 감시를 통해 빅데이터를 어떤 방식으로 수집하고 활용하는지 알고리즘을 공개해야 한다고 이야기한다. 이를 통해 건전한 피드백으로 알고리즘이 개선되게 하자는 주장이다.
맞는 말이다. 맞는 말인데 문제는 이렇게 하면 캐시 오닐이 주장한 것처럼 알고리즘을 순한 양처럼 길들일 수 있느냐는 것이다. 일단 이게 안되는 이유는 US 뉴스의 대학랭킹 사례만 봐도 알 수 있다. 블랙박스형 알고리즘이 아니라 투명하게 산정 방식을 공개하면 사람들은 그 알고리즘의 평가 방식대로 자신의 행동을 수정하게 된다. 이는 US 뉴스의 대학랭킹이 나왔을때 수많은 대학들이 평가 항목에 따라 그들의 교육 방식과 행정 등을 맞춰갔다는 점에서 예상 가능한 미래다. 이 경우 다른 방식으로 알고리즘은 사람들을 분류할 수밖에 없다.
알고리즘을 통해 그룹화된 집단 특성은 개인의 행동을 예측할 수 없단 말 또한 말은 맞지만 이게 진정 가능하느냐는 별개의 일이다. 당위와 실천 가능성은 전혀 별개의 일이다. 개개인의 정보와 특성을 온전하게 파악한다 해도 개인이 미래에 어떤 행동을 할지 예측하는 것은 불가능하다. 과거의 데이터가 미래를 알려주지 못한다는 것은 여기에도 동일하게 적용된다. 따라서 해당 개인이 속한 집단적 특성을 통해서 확률적으로 판단을 하는 것이다.
그래서 이를 비판한 내용은 나로서는 저자가 대체 무얼 말하고 싶은건지 이해가 잘 되지 않았다. 집단적 특성을 통한 분석이 문제가 많긴 하지만 그건 개인에 대한 분석이 불가능하기 때문에 선택하는 차선이다. 오닐의 비판은 개개인성에 초점을 두어도 여전히 동일하게 적용되며 설명력은 더 낮아진다는 점에서 무의미한 주장이다. 또한 그런 개개인성에 초점을 두려면 개인으로부터 더 많은 정보를 수집해야 한다. 그런데 캐시 오닐은 또 이런 것은 프라이버시의 침해이며 부유한 자만 프라이버시를 보호할 수 있다고 비판을 한다. 도대체 어쩌자는 건지 이해가 잘 안된다.
캐시 오닐이 [대량살상 수학무기]를 통해 빅데이터와 알고리즘이 가진 어두운 부분을 보여주고 빅데이터가 만능이 아니라는 주제의식은 충분히 납득하고 우리가 눈여겨 봐야 할 부분이다. 하지만 각각의 개별 사례들의 위험은 다소 과장되어 있으며 그 해법이나 대안 또한 제대로 된 것이라 보기 어렵다. 캐시 오닐의 주장을 따르자면 어떤 부분에선 카테고라이징 자체를 하지 않는게 해법이 되기도 하는데 이건 그냥 주요 산업이나 행정 등의 기반을 해체해야 하는 수준이다.
분명 우리가 빅데이터를 지나치게 아름답게 보고 신격화 하고 숭배하는 현상이 있는 것은 사실이다. 그래서 빅데이터의 단점과 어두운 면을 인지하고 균형감 있게 바라보는 것은 매우 중요하다. 하지만 그렇다고 해서 빅데이터를 괴물로 만들어 바라볼 이유는 없다고 본다. 세상의 모든 일은 나름대로의 단점이 존재하기 마련이다.
이 책을 읽는 다면 그런 주제의식은 충분히 받아들이는 것이 좋다. 다만 이 책이 문제로 삼는 부분에서 더 나은 대안이 있는가와 이 책이 제안하는 해법이 실천 가능한가에 대해서는 이 책이 빅데이터에 갖는 의문만큼이나 비판적으로 바라보는 것이 필요하다 생각한다.