brunch

You can make anything
by writing

C.S.Lewis

by Viel Liebe Jul 21. 2020

#11 토픽 모델링 결과

‘길거리’가 드러내고, 구글 검색엔진이 기억하는 한국사회의 젠더권력

'구글검색의 젠더권력'을 주제로 탐구하는 중이다. 일상어가 남성의 시선에서 폭력적으로 재의미화되는 양상을 분석하고자 했다. 그러한 담론을 수학적으로 분석하기 위해, 파이썬을 이용한 LDA 토픽모델링을 활용했다. 핵심은 #8 글에서 이야기한 바와 같다.


길거리


길거리를 검색했을 때 나오는 상위 100개 이미지의 제목으로 토픽 모델링한 결과다.

길거리 상위 100개 검색결과 토픽모델링 결과


1,3,4번이 불법촬영물과 관련된 성희롱적 담론이었다. 1번 토픽은 ‘길거리’ ‘여성’ ‘사진’ ‘모음’에 관한 토픽이었다. 4번은 ‘몸매’, ‘처자’, ‘수준’ 등의 키워드를 포함한 토픽으로, 길거리 여성의 몸매를 품평하는 담론이었다. 3번 토픽에서는 길거리 여성의 소위 말하는 후방주의 사진, 즉 “남성의 성적 욕구를 자극하며 밖에 나가서 보기는 부끄러운 사진”에 대한 담론이 형성되어 있었다. 토픽의 크기를 감안할 때 전체 담론의 40% 이상이 길거리 여성의 신체를 관음하는 남초 커뮤니티의 문화에 영향을 받았다.


길거리 상위 300개 검색결과 토픽모델링 결과

하지만 상위 300개 이미지로 대상을 넓혀 토픽 모델링을 했을 때, 이러한 경향성은 2번 토픽으로 축소되었다. 길거리 투어, 길거리 음식 등 조금 더 일상적이고 길거리의 본래 의미에 가까운 담론이 형성되고 있었다. 성희롱적 담론 밖에도 다른 검색결과가 많다는 사실은, 같은 검색어에 대한 검색결과도 여러 방식으로 다르게 배치할 가능성이 존재함을 시사한다.


일반인


일반인 상위 100개 검색결과 토픽모델링 결과

 한편 일반인 검색 결과의 이미지 100개를 토픽 모델링했을 때, 중간과 오른쪽 부분의 토픽들이 일반인 여성의 신체를 품평하고 성적 유희의 대상으로 삼는 담론이었다. 일반인 여성의 비키니 사진을 모아놓거나, 일반인이 포함된 제목으로 후방주의 사진이나 노출 사진을 게시했다.


일반인 상위 300개 검색결과 토픽모델링 결과

300개로 대상을 넓혔을 때는, 길거리와 마찬가지로 1번 토픽만으로 성희롱적 담론의 비중이 축소되었다.


조수석


조수석 상위 100개 검색결과 토픽모델링 결과


조수석 이미지 100개에서는 오른쪽 하단의 토픽들(1,4,9,10)이 성희롱적 담론이었다. 크기가 가장 큰 1번 토픽에서는 ‘조수석 민폐녀’ 라는 밈으로 조수석에 앉은 여성의 신체를 희롱하는 문화가 존재함을 확인했다. 4,9,10번 토픽도 민폐녀라는 밈을 중심으로 구성되어 있었다.


조수석 상위 300개 검색결과 토픽모델링 결과

300개로 늘렸을 때에는, 성희롱적 담론이 1번 토픽만으로 줄어들었음을 확인했다. 1번이 크기가 가장 큰 토픽임을 짚고 넘어가겠다.


호불호


호불호는 분석한 일상어들 가운데, 여성의 신체를 품평하는 담론이 가장 만연한 단어였다. 이는 일반적인 좋고 싫음이라는 호불호의 본래 의미가, 온전히 남성의 시선에서 여성의 신체를 평가하기 위한 문화적 의미로 축소된 채 굉장히 흔하게 쓰이고 있음을 드러낸다. 길거리라는 일상적 공간의 의미가 변질된 현상만큼, 호불호의 의미 변화도 상징적이다.


호불호 상위 100개 검색결과 토픽모델링 결과

이미지 100개의 토픽 모델링 결과에서는, 우원재와 기리보이의 노래를 이야기하는 10번 토픽을 제외하고는 전부 여성의 신체의 호불호를 논하는 담론이었다. 남초 커뮤니티에서는 ‘호불호 갈리는 몸매/패션’ 등의 밈으로 여성의 신체를 희롱하고 있었다.


호불호 상위 300개 검색결과 토픽모델링 결과

300개 토픽 모델링 결과에서 이는 3번 토픽 포함 왼쪽의 토픽들만으로 축소되었다.


각각의 토픽 모델링 결과는 한국 남성이 일상어를 폭력적으로 재의미화하는 양상을 드러내며, 남성의 시선에서 여성의 신체를 소비하는 젠더권력이 일상적 언어에도 뿌리내리고 있음을 의미한다. ‘야한 여자 사진’ 같은 검색어가 아니라 길거리나 호불호와 같은 일상어를 검색했을 때도, 구글검색 알고리즘은 불법촬영물과 성희롱적 게시물이 제공하고 있었다. 한국 남성이 그런 이미지를 원했고 소비했으며, 알고리즘이 그러한 한국 남성을 기억했기 때문이다.


한편 검색결과 하단으로 갈수록 검색어의 본래 의미에 충실한 검색결과가 많아지는 것으로 볼 때, 지금 구글검색 알고리즘은 남성적 시선의 이미지를 우선 제공함으로써 여성보다 남성을 우선적으로 호출하고 있었다. 여성이 선호하는 또는 모두가 동등하게 선호하는 종류의 결과를 호출하도록 알고리즘을 개선할 수는 없는지 고민하게 된다.

매거진의 이전글 #10 통화 기록으로 부의 수준 예측하기
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari