brunch

You can make anything
by writing

C.S.Lewis

by Viel Liebe Sep 18. 2020

#14 사회혁신 프로젝트 최종보고서 <2>

구글검색의 젠더권력

4. 탐구 결과 – 토픽 모델링

*하단 첨부파일 참고해주세요

**#15 글로 올릴 워드클라우드는 보다 직관적인 그림을 제공합니다.

길거리 상위 100개 검색결과 토픽모델링 결과

이제 토픽 모델링 결과를 살펴보겠습니다. 길거리를 검색했을 때 나오는 상위 100개 이미지의 제목으로 토픽 모델링한 결과, 1,3,4번이 불법촬영물과 관련된 성희롱적 담론이었습니다. 1번 토픽의 경우에는 길거리 여성의 사진을 모아두었고, 4번 토픽은 ‘몸매’, ‘처자’, ‘수준’ 등의 키워드에서 볼 수 있듯이 길거리 여성의 몸매를 품평하는 담론이었습니다. 3번 토픽에서는 길거리 여성의 소위 말하는 후방주의 사진, 즉 남성의 성적 욕구를 자극하며 밖에 나가서 보기는 부끄러운 사진에 대한 담론이 형성되어 있었습니다.


길거리 상위 300개 검색결과 토픽모델링 결과

하지만 상위 300개 이미지로 대상을 넓혀 토픽 모델링을 했을 때, 이러한 경향성은 2번 토픽으로 축소되었습니다. 길거리 투어, 길거리 음식 등 조금 더 일상적이고 길거리의 본래 의미에 가까운 담론이 형성되고 있었습니다.

일반인 상위 100개 검색결과 토픽모델링 결과

한편 일반인 검색 결과의 이미지 100개를 토픽 모델링했을 때, 중간과 오른쪽 부분의 토픽들이 일반인 여성의 신체를 품평하고 성적 유희의 대상으로 삼는 담론이었습니다. 일반인 여성의 비키니 사진을 모아놓거나, 일반인이 포함된 제목으로 후방주의 사진이나 노출 사진을 게시했습니다.

일반인 상위 300개 검색결과 토픽모델링 결과

300개로 대상을 넓혔을 때는, 길거리와 마찬가지로 1번 토픽만으로 성희롱적 담론의 비중이 축소되었습니다.

조수석 상위 100개 검색결과 토픽모델링 결과

조수석 이미지 100개에서는, 오른쪽 하단의 토픽들이 성희롱적 담론이었습니다. 크기가 가장 큰 1번 토픽에서는, 조수석 민폐녀 라는 밈으로 조수석에 앉은 여성의 신체를 희롱하는 문화가 존재함을 확인할 수 있습니다. 

조수석 상위 300개 검색결과 토픽모델링 결과

300개로 늘렸을 때에는, 성희롱적 담론이 1번 토픽만으로 줄어들었음을 확인했습니다.


호불호는 분석한 일상어들 가운데, 여성의 신체를 품평하는 담론이 가장 만연한 단어였습니다. 이는 일반적인 좋고 싫음이라는 호불호의 본래 의미가, 온전히 남성의 시선에서 여성의 신체를 평가하기 위한 문화적 의미로 축소된 채 굉장히 흔하게 쓰이고 있음을 드러냅니다. 길거리라는 일상적 공간의 의미가 변질된 현상만큼, 호불호의 의미 변화도 상징적이라고 생각합니다.

호불호 상위 100개 검색결과 토픽모델링 결과

이미지 100개의 토픽 모델링 결과에서는, 우원재와 기리보이의 노래를 이야기하는 10번 토픽을 제외하고는 전부 여성의 신체의 호불호를 논하는 담론이었습니다.

호불호 상위 300개 검색결과 토픽모델링 결과

300개 토픽 모델링 결과에서 이는 3번 토픽 포함 왼쪽의 토픽들만으로 축소되었습니다.


각각의 토픽 모델링 결과는 한국 남성이 일상어를 폭력적으로 재의미화하는 양상을 드러내며, 남성의 시선에서 여성의 신체를 소비하는 젠더권력이 일상적 언어에도 뿌리내리고 있음을 의미합니다. ‘야한 여자 사진’ 같은 검색어가 아니라 길거리나 호불호와 같은 일상어를 검색했을 때도, 구글검색 알고리즘은 불법촬영물과 성희롱적 게시물이 제공하고 있었습니다. 한국 남성이 그런 이미지를 원했고 소비했으며, 알고리즘이 한국 남성을 그렇게 기억했기 때문입니다.


한편 검색결과 하단에 검색어의 본래 의미에 충실한 검색결과가 많아지는 것으로 볼 때, 지금 구글검색 알고리즘은 남성적 시선의 이미지를 우선 제공함으로써 여성보다 남성을 우선적으로 호출하고 있었습니다. 여성이 선호하는 또는 모두가 동등하게 선호하는 종류의 결과를 호출하도록 알고리즘을 개선할 수는 없는지 고민하게 됩니다.


5. 보완적 탐구


다음으로 이 현상이 한국의 남성에게서만 특수하게 관찰되는 현상인지 따져볼 텐데, 젠더라는 주제와 관련 있으면서도 남성과 여성을 동일선상에 놓고 비교할 수 있는 검색어를 찾아야 했습니다.


보이그룹과 걸그룹을 사례로 들기로 했습니다. 아이돌 자체가 남성과 여성이 성적으로 소비되는 양상을 잘 드러내주는 개념이며, 보이그룹은 대체로 여성이 검색하고 걸그룹은 대체로 남성이 검색할 것이기 때문입니다. (물론 그렇지 않은 경우도 종종 있겠지만요.)


기본적으로 아이돌 자체가 성 상품화 논란을 지닌 주제이긴 하지만, 근본적인 논의는 미뤄놓고 걸그룹과 보이그룹이 성적으로 소비되는 양상을 분석하고자 했습니다. 우선 검색결과를 둘러봐도 양쪽 모두 특별히 폭력적인 방식으로 남성/여성의 신체를 소비하는 정황은 찾을 수 없었습니다. 여러 걸그룹과 보이그룹에 대한 소개가 검색결과의 대부분을 이루었습니다.


그러나 검색의 이미지 결과를 좁혀주는 키워드에서는 차이를  확인했습니다. 키워드는 이러한 형식으로 제시되고, 키워드를 클릭하면 그 카테고리에 해당하는 이미지로 검색 결과가 좁혀집니다.

 

키워드 목록은 아래와 같습니다. 주목할 만한 키워드에는 하이라이트 처리를 했습니다.


먼저 걸그룹의 사례를 보면, 다소 기형적인 방식으로 걸그룹을 소비하는 문화가 여러 키워드에서 드러나고 있습니다. 여성의 신체를 파편화하여 성도착적으로 소비하도록 안내하는 키워드들이 많습니다. 어느 수위부터 성도착적이냐, 성희롱적이냐 하는 주관적인 문제는 차치하더라도, 걸그룹의 신체를 소비하는 방식에 걸그룹 당사자들이 동의하지 않을 것이라고 생각합니다.


이에 반해 보이그룹은 일단 키워드의 수가 적었습니다. 키워드로 내놓을 만한 굵직한 담론이 많지 않았다는 의미일 것입니다. 보이그룹의 키워드에서도 논쟁적인 단어를 하나 찾을 수 있지만, 남성이 걸그룹을 소비하는 방식과 여성이 보이그룹을 소비하는 방식에 상당한 차이가 존재함을 양쪽의 결과가 나타내고 있습니다.


상당한 수의 남성은 지속적으로 걸그룹의 신체를 파편화시키고, 자신의 성적 쾌락을 자극하는 도구로 활용하고 있었습니다. 앞서 살펴본 토픽 모델링 결과와, 아이돌의 성적 소비 양상의 차이로부터 일상어의 폭력적 재의미화가 남성의 문제임을 간접적으로 확인할 수 있습니다.


추가적으로 해외 남성의 사례도 살펴보겠습니다. 구글 알고리즘에 나타나는 성차별을 비판한 사피야 우모자 노블의 강연에서 따온 자료로, 2014년에 black girls (흑인 소녀)와 beautiful (아름다운)을 검색했을 때 나온 이미지 결과들입니다.        


여성의 신체를 성적 유희를 위한 담론으로 소비하는 것은 한국의 남성만이 아니라, 전 세계 남성이 공유하고 있는 문제로도 볼 수 있었습니다. 다만 성(姓)적 의미가 전혀 담겨있지 않은 길거리나 일반인과 같은 일상적인 단어에서도 폭력적 담론이 형성된다는 사실은 한국의 여성인권에 대해 시사하는 바가 큽니다. 구글 측에서는 이런 결과가 더는 나오지 않도록 필터링 장치를 개발했습니다.


문제의 큰 책임이 사용자 남성에게 있다고 살펴보기는 했지만, 이제 black girls와 beautiful과 관련해서 남성과 여성이 불평등하게 호출되는 상황을 멈추었다는 점에서 살펴본 일상어의 문제를 해결할 수 있다는 희망을 얻습니다. 물론 이보다 중요한 일은, 사용자 대중을 차별적으로 호출하지 않는 알고리즘을 만드는 일입니다.


6. 제언, 결론 및 함의


간단한 일은 아니지만, 구글검색 알고리즘의 기본 바탕이 되는 PageRank 기법을 가볍게 살펴보고 제언을 덧붙여보겠습니다. PageRank 알고리즘은 특정 게시글이 타 게시글에서 언급된 횟수를 측정해 검색결과 배치에 반영합니다. 이런 방식으로 검색결과는 영향력 순으로 정렬됩니다.


그런데 앞선 검색어들로 살펴보았듯이, 특정 집단의 사용자가 특정 단어를 전유하는 경우 그 단어의 의미를 폭력적인 방식으로 왜곡할 가능성이 있었습니다.(‘길거리’의 경우에는 남성이 길거리라는 단어를 전유했습니다) 그렇다면 게시글을 인용하려는 사람의 인구학적 특성을 검색결과 정렬에 반영한다면 어떨까요?


불법촬영물을 확산시키는 사용자가 남성이라면, 그 정보를 기억해둡니다. 또 길거리에 관한 다른 게시글 예컨대 길거리 음식 사진을 공유하는 여성이 있다고 하고, 길거리 검색결과 문제는 길거리 불법촬영물을 검색한 남성이 길거리 음식을 검색한 여성보다 수적으로 많았기 때문에 발생했습니다. 그렇다면 남성과 여성을 동등하게 대표하기 위해 남성의 인용과 여성의 인용에 각각 가중치를 부여해보는 방안을 생각해볼 수 있습니다. 이처럼 대중을 평등하게 호출하는 알고리즘은 얼마든지 가능합니다.


프로젝트의 결론과 함의를 정리하면서 보고서 마치도록 하겠습니다.

- 길거리, 일반인, 조수석, 호불호라는 일상어가 폭력적인 담론으로 재의미화되는 양상을 확인하였습니다.

- 검색결과 하단으로 갈수록 폭력적 담론의 비중이 줄어든다는 점에서, 구글이 사용자 대중을 차별적으로 호출하고 있음을 확인하였습니다.

- 걸그룹과 보이그룹의 이미지 결과 키워드를 살펴봄으로써, 일상어의 폭력적 재의미화가 여성보다는 남성에게 주로 나타나는 현상임을 간접적으로 확인하였습니다. 하지만 한국 남성만이 아니라 전 세계적으로 비슷한 문제가 존재했었고 존재하고 있습니다. 구글에서 나서서 그 중 일부를 필터링하였고, 이는 지금의 문제에 대한 긍정적 전망을 제시합니다.

하지만 필터링보다는 평등한 알고리즘이, 평등한 알고리즘보다는 평등한 성 문화가 더 근본적인 해결책일 것입니다.



*토픽모델링 결과자료


매거진의 이전글 #14 사회혁신 프로젝트 최종보고서 <1>
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari