알고리즘을 누구의 편인가

[읽으면서 배우고 쓰면서 성장하는]

Mar 12. 2020

photo-1543185377-99cd16011803?ixlib=rb-1.2.1&ixid=eyJhcHBfaWQiOjEyMDd9&auto=format&fit=crop&w=1000&q=80

나는 평소 쉬거나 혼자 밥을 먹을 때 유튜브 틀어놓고 보면서 시간을 보내는 경우가 많다. 그러다 가끔씩 참으로 친절한 유튜브 알고리즘이 "추천"해주는 영상 콘텐츠 홍수에 빠져 넋을 놓고 보다 은근 시간을 허비한 경우고 있다.

그리고 유튜브뿐만이 아니라 우리가 사용하고 접하는 다양한 플랫폼 들은 알고리즘을 통해 사용자의 취향을 찾고 '추천'해주기 위해 수많은 데이터를 수집하고 처리하며 머신러닝, 딥러닝을 활용해 견고한 알고리즘을 만들기 위해 혈안이 되어 있다. 그러면 왜 플랫폼은 '추천' 알고리즘에 많이 시간과 비용을 투자하는 것일까?

이유는 매우 간단하다. 추천 알고리즘을 통해 사용자가 플랫폼에 오래 머물게 함으로써 플랫폼 안에 있는 콘텐츠 혹은 제품을 소비시키기 위해서 이다. (실제 '추천 알고리즘'을 통해 많은 기업들이 수익 창출에 많은 영향을 받고 있다) 그리고 추천 알고리즘 이외에도 많은 기업들은 다양한 알고리즘을 통해 많은 요소들을 자동화시켜 분류하는 작업을 진행하고 있다.

알고리즘은 어떻게 만들어지는가?

우리가 사는 삶에는 생각보다 더 많이 "알고리즘"에 영향을 받고 있다. 플랫폼 이외에도 많은 기업과 국가 기관에서도 알고리즘을 적용해 다양한 방면에서 분류하고 평가하는 모델들이 적용되고 있다. 하지만 많은 사람들은 알고리즘이 어떻게 만들어지고 작동하는지 모른 채 주어지는 대로 받아들이고 있다. (당연하게도 알고리즘을 만든 엔지니어, 학자들이 공개를 하지 않는 이상 알 방법이 없다) 아는 것이라고는 과거 모아진 데이터 그리고 현재 생겨나는 데이터를 활용한다는 점이 전부이다. 그리고 끊임없이 화두가 되는 딥러닝 분야도 "성능"은 좋지만 왜 '성능'이 좋은지에 대한 내부 작동에 대해서 설명이 안 되는 경우도 많다. (최근 AI 분야에서도 XAI 라는 설명가능한 딥러닝 모델을 개발하자는 연구 동향이 나오고 있다)

알고리즘은 과연 공평한가?

photo-1548414961-6a0779011a2a?ixlib=rb-1.2.1&q=85&fm=jpg&crop=entropy&cs=srgb

그렇다면 여기서 몇 가지 의문점이 생긴다.

어떻게 동작하지도 모르는 "알고리즘"이라는 것을 우리는 과연 있는 그대로 받아들여도 괜찮을까?

그리고 알고리즘은 공평하게 우리의 삶에서 작동하고 있을까?

"수학 모형은 본질적으로 과거와 기존 패턴들이 반복될 것이라는 가정에 기반을 두고 있다."

<대량살상 수학 무기 - 73page>

알고리즘은 대개 수학적인 모형으로 만들어진다. 그리고 대부분의 수학 모형들은 과거 데이터 기반으로 현재를 예측하고 정의를 내린다. 그렇다면 ' "과거 데이터"는 과연 공평한 것 일까?'라고 의문이 든다. 대부분의 데이터들은 "사람"이 만들어 낸 것이다. 그리고 "인간"이라고 함은 공평할수 없다. 배경, 환경 사고방식이 모두 다르고 또한 인간의 뇌는 편향적 사고 속에서 많은 결정을 한다. 그래서 인간이 만든 데이터가 "공평"하다고 볼 수는 없다. 오히려 편향적인 결과를 가져다줄 수 있다. 그로 인해 알고리즘으로 소외되고 차별받는 사례가 계속해서 생겨날 것이고 이러한 문제를 무시한 채 알고리즘을 지속한다면 더욱 편향적으로 흘러갈 것이고 다양성은 존중받지 못할 수도 있다.

그리고 실제 대량살상 수학 무기라는 책에서 소개된 사례 중 미국 대학 평가 모델로 인해 많은 대학이 평가 모델에 맞춰 대학을 바꿔 나갔고 대학에서의 학문적 다양성은 존중받지 못한 체 평가에서 많은 배점을 받을 수 있는 방향으로 대학을 맞춰 나갔다고 한다. 이처럼 알고리즘은 누가 어떤 기준을 가지고 만드냐에 따라 다양성을 파괴시킬 수 있고 차별적인 루프가 생겨날 수 있다.

"불완전한 모형을 평범하게 사용하고, 성공을 자기중심적으로 정의하며, 차별적 피드백 루프가 갈수록 강력해지고 있었다."

<대량살상 수학 무기 - 91page>

모형 개발자들은 모형을 어떤 기준을 가지고 모형을 만들었는지 확인해야 하고, 현재 모형이 "효과성"으로 인해 "공정성"이 무너진 것이 아닌지 끊임없이 점검하는 과정이 필요하다.

모형 공개

?fname=http%3A%2F%2Ft1.daumcdn.net%2Fbrunch%2Fservice%2Fuser%2F6tNj%2Fimage%2FLFPPbg5H75UdZG8shIskfmHUF58

"모형 개발자들의 어떤 목적을 가지고 기준을 정하는가?" <대량살상 수학 무기 - 109page>

사실 모형에 대한 투명성에 대한 이슈들은 예전부터 언급이 되고 문제점으로 지적이 많이 되고 있는 부분이었다. 그래서 비즈니스에 모형을 적용하는 기업 그리도 다양한 업체들은 해당 적용 모델에 대한 "공개"를 해야 한다는 목소리도 나오고 있다. 하지만 기업 입장에서는 모형도 하나의 비즈니스 모델 일수도 있고, 해당 기업만의 경쟁력이기 때문에 공개하기는 쉽지 않을 것이다. 하지만 인간의 삶에서 민감하게 작용되는 부분에서의 "모형"들은 공개될 필요가 있고, 개인의 정보를 기업에게 제공하는 사용자들도 모형 공개 그리고 개인정보의 활용에 대해 관심을 가지고 목소리를 낼 필요가 있다. 또한 사용자들의 개인의 정보를 사용하는 기업 입장에서도 개인의 정보가 유출 혹은 악용이 되지 않게 책임감을 가지고 의사결정을 진행해야 할 것이다. 또한 오히려 투명성과 공정성을 가진 착한 모형들은 장기적인 관점에서 긍정적인 피드백 루프를 가져갈 수 있다는 점에서 무엇보다 신중히 결정해야 할 문제이다.

그리고 무엇보다 모형을 선택하고 적용하는 데에 있어 최종 결정권은 '인간'이기 때문에 결과에 대한 책임에 대해서도 명확히 인지하고 넘어가야 할 것이다.

착한 모형 & 나쁜 모형

페이스북 10년 '위험한 실험' 이번뿐일까

과거 페이스북이 플랫폼에서 알고리즘을 활용해 감정 전염 실험을 진행하고 논문을 공개한 적이 있다. 페이스북은 "실험" 목적으로 진행했기 때문에 내부에서 조심스럽게 진행되었고 검토 절차도 걸쳤다고 한다. 하지만 해당 실험으로 인해 부정적이든 긍정적이든 해당 플랫폼 유저들에게 "영향"을 줬다는 점에서 큰 논란이 되었다. 그리고 만약 페이스북이 이런 실험을 진행한 것을 공개하지 않았다면 어땠을까? 아마 사용자들은 가만히 알고리즘에 실험 도구로써 사용되어졌을 것이다. 그리고 만약 나쁜 방향으로 계속 모형을 적용했다면 어떤 결과를 가져올지는 아무도 모르는 일이다.

반대로 플랫폼에서 생겨나는 수많은 "데이터"를 좋은 방향으로 사용한다면 소외되고 왜곡되는 진실과 사람들을 도와줄 수 있고 인간이 사는 삶을 좀 더 윤택하게 만들어 나갈 수도 있다. 그리고 실제로 다양한 기업과 개인들이 "착한 모형"을 개발에 세상에 많은 기여를 하고 있다.

그래서 궁극적으로 기업-정부-개인 모두가 지금 시점에서 급변하고 급증하는 "데이터"를 어떤 식으로 적용되어야 하는지에 대해 끊임없이 관심을 가져야 하고 질문을 던져야 한다.

keyword

매거진의 이전글결혼이란 틀에서 벗어나 우리는 무엇을 준비해야 하는가누가 한 분야의 전문가가 되는가?매거진의 다음글