구글검색의 젠더권력
*2020.07 기준으로 탐구/작성된 보고서입니다.
강의에서 다룬 알고리즘과 관련하여, 저는 우리의 현실에 존재하는 유해한 알고리즘을 찾아보았습니다. 《대량살상 수학무기》에 등장하는 사례들은 모두 미국의 사례들이었기 때문입니다. 이런저런 논문을 탐색하던 중, 「한국여성의 인권에 대해 알고 싶으면, 구글에서 ‘길거리’를 검색해보라: 알고리즘을 통해 '대중들' 사이의 적대를 가시화하기」라는 제목의 논문을 읽게 되었습니다.
우리나라 구글에서만 ‘길거리’라는 키워드가 길거리 여성을 대상으로 한 불법촬영물들로 이어지는 현상은, 한국 사회의 젠더권력을 드러내는 꽤나 유명한 사례입니다. 여성에게는 일상적인 삶을 향유하는 공간이, 상당수 남성에게는 여성의 신체를 자신들의 관음증적 시선에서 주조하는 이질적인 의미를 가짐을 드러내기 때문입니다.
또한 이 현상은 ‘길거리’ 검색결과의 상단에 ‘길거리 OO녀’ 등으로 길거리 여성의 몸매를 희롱하고 품평하는 남성집단의 문화가 존재하며, 그것이 구글 검색결과의 상단에 나타날 정도로 큰 양과 지속성을 지님을 시사합니다.
논문에서는 이 상황을 바라보는 두 가지 시각을 분류합니다. 하나는 문제를 구글의 검색 정책에서 비롯되었다고 보는 관점입니다. 음란물 유통을 제대로 단속하지 못하고, ‘길거리’라는 단어가 지닌 의미론적 결과를 도출하지 못하는 알고리즘의 내적 문제에 주목합니다.
많은 언론이 ‘길거리’ 문제를 바라볼 때 알고리즘의 내적 문제에 초점을 맞추고 있습니다. ‘미디어오늘’의 기사에서는, 한국 이용자의 작은 규모로 충분한 피드백을 받지 못하며 국내법의 규제에서도 벗어나 있는 구글 검색엔진의 한계를 지적합니다. ‘한국경제’에서도 검색 필터링 기능을 제대로 마련하지 않은 구글과, 관련 법규를 정비하지 않는 정부를 비판합니다.
이 관점에서 문제가 되는 것은, 의미론적으로 무관한 검색결과를 도출하는 알고리즘적 오류와, 음란물 유통을 방치하는 구글의 필터링 정책입니다. 논문에서는 이 관점의 타당성도 인정하지만, 대안적인 시각을 제시합니다. 그것은 ‘알고리즘적 상상’에 입각해 문제에 접근하는 것입니다.
알고리즘적 상상이란 “알고리즘의 작동에 대해 대중들이 경험, 지각, 상상하는 방식”을 말합니다. 이 용어는 알고리즘이 그 사용자와 적극적으로 상호작용함을 전제로 합니다. 이러한 관점에서, 알고리즘은 통계적 분석을 통해 사용자가 특정 단어를 어떠한 언어적 문화적 맥락에서 활용하는지를 ‘기억’합니다.
나아가 알고리즘은 특정한 대중을 ‘호출’합니다. 이는 알고리즘이 개인보다 큰 단위에서 사용자와 상호작용하기 때문입니다. 알고리즘은 나이, 성별, 인종 등 다양한 기준으로 사용자 전체를 인구학적 집단으로 쪼갠 뒤, 각 사용자가 속한 인구학적 집단의 특성에 맞는 검색정보로 사용자를 안내합니다. 알고리즘적 상상이 환기하는 ‘기억’과 ‘호출’의 기능으로부터 우리는 현상에 대한 새로운 두 가지 통찰을 얻습니다.
먼저 알고리즘이 기억한다는 발상에서 출발하여, ‘길거리’의 검색결과가 구글검색 알고리즘이 한국 남성을 기억한 결과라고 생각해볼 수 있습니다. 알고리즘이 불법촬영물을 제시한 것은 사용자가 원한 결과가 불법촬영물이었기 때문이며, 알고리즘은 다만 사용자의 그러한 성향을 기억했을 뿐입니다.
알고리즘은 ‘길거리’ 자체의 의미에는 관심이 없고, 다만 그것이 어떤 언어적 맥락에서 활용되는지를 수학적으로 분석합니다. 이러한 맥락에서 길거리 검색결과의 문제는 알고리즘이 아니라 한국 남성들의 책임으로 넘어옵니다. 일상적 삶의 공간을 관음증적 시선으로 재의미화한 주체는 알고리즘이 아니라 한국 남성인 것이죠. 이 사실을 놓친 채 알고리즘만을 비판하는 일은 의미가 제한적입니다.
여기서 한 가지 중요한 사실을 짚고 넘어갈 필요가 있는데, 그것은 불법촬영물로 이어진 검색어가 일상어라는 점입니다. 뒤에서 다른 일상어들도 살펴볼 텐데, 우리의 삶과 밀접하게 관련된 일상어가 성적 유희의 담론에서 활용되고 있다는 사실은, 결국 누군가의 일상이 언제나 폭력적으로 재의미화될 위협 속에 처해 있음을 시사합니다.
이는 힘있는 쪽이 힘없는 쪽의 일상을, 남성이 여성의 일상을 자기중심적으로 재구성하는 과정입니다. 이는 단지 구글 검색결과일 뿐이지만, n번방 사건과도, 나아가 서울역 폭행과도 맞닿아 있습니다. 잠시 소개한 논문의 일부 구절을 인용하고 넘어가겠습니다.
<이상한 나라의 앨리스>에서 토끼굴이 앨리스를 일상의 현실과는 다른, 기묘하고 환상적인 모험의 세계로 인도했다면, 구글 ‘길거리’ 검색의 토끼굴은 ‘나의 일상’이 ‘너의 포르노’가 되어 버린 현실의 기괴한 단면을 체험하게 하면서, 일상 속에서는 은폐되어 있던 성적 적대를 가시화한다.
알고리즘적 상상이 제공하는 두 번째 통찰은 알고리즘의 호출에 관한 것입니다. 구글검색이 사용자를 인구학적 집단으로 분류하고 그에 맞는 검색결과로 안내한다는 점에서, 알고리즘은 대중을 호출하는 기능도 수행합니다. 그런데 길거리 검색결과로 제시되는 불법촬영물은 남성 대중을 중심적으로 호출합니다.
여성의 신체를 대상화하고, 관음증적 시선으로 주조하는 수많은 이미지를 유통하고 소비하는 주체가 여성이라고 보기는 어렵다는 점에서 그렇습니다. 불법촬영물이 돌아다니는 사이트가 대체로 남초 커뮤니티이기도 합니다.(블로그나 핀터레스트라는 예외도 있습니다.)
구글검색 알고리즘이 길거리 불법촬영물로써 남성을 호출하고 있다면, 우리는 같은 검색어가 여성 대중은 호출할 수 없는지 질문하게 됩니다. 또한 알고리즘이 특정 검색결과로 남성과 여성을 호출한다고 할 때, 남성과 여성을 호출하는 검색어들이 각각 어떠한 방식으로 재의미화되는지 따져볼 수 있습니다. 이를 통해 일상어의 폭력적 재의미화가 한국 남성에게서만 나타나는 현상인지 확인할 수 있을 것입니다.
정리하자면 다음 세 가지가 프로젝트의 목적입니다.
1. 구글검색 알고리즘이 한국 남성을 어떻게 기억하고 있는지
2. 구글검색 알고리즘이 어떤 종류의 대중을 중심적으로 호출하고 있는지
3. 구글검색 알고리즘에 비추어 볼 때, 일상어의 폭력적 재의미화가 1)한국의 2)남성에게서만 특수하게 관찰되는 현상인지
토픽 모델링을 활용하여 1,2번 질문에 답하고, 3번과 관련해서는 보조적인 사례들을 살펴볼 것입니다. 우선 1,2번 질문에 답하기 위해 저는 4가지 일상어(길거리, 일반인, 조수석, 호불호)를 중심으로, 구글 검색의 이미지 결과에 딸려있는 제목들을 대상으로 토픽 모델링을 돌렸습니다.(selenium으로 크롤링하고, komoran으로 자연어처리하고, LDA 토픽모델링을 활용했습니다.)
상위 100개 결과와 상위 300개 결과로 각 단어에 대해 한 번씩 실행했습니다. 각각의 결과는 일상어가 폭력적으로 재의미화되는 맥락을 보여줌으로써, 알고리즘이 기억하는 한국 남성의 모습을 보여줄 것입니다.
한편 저는 스크롤을 내릴수록 불법촬영물 내지는 성희롱적 게시물의 비중이 조금 줄어드는 현상을 발견했는데요, 그러한 게시물이 아무리 많다고 해도 검색어의 기본적 의미에 충실한 검색결과도 그에 못지않게 많기 때문일 것입니다.
만약 상위 100개의 토픽 모델링 결과보다 300개의 결과에서 불법촬영물과 성희롱적 게시물의 비중이 적다면, 구글이 남성중심적 시선의 이미지를 검색결과 상단에 배치함으로써 남성과 여성을 차별적으로 호출하고 있다고 볼 수 있습니다. 이는 알고리즘을 개선함으로써 해결할 수 있는 문제일 것입니다.