|Vignette -맥락이 없으니 이렇게 됐지...|
5월 말 나는 내가 소속된 대학이 주관한 콘퍼런스에서 현재 진행중인 나의 연구 (가제: AI 알고리즘에 의한 한반도에서의 정치적 편향성 강화 현상 탐색)에 대해서 발표를 했다. 아직 실증적인 데이터를 수집하기 전 단계였기 때문에 내가 왜 이 연구에 관심을 갖게 되었는지, 기존의 연구들은 주로 어떤 결과를 발표했는지, 데이터를 어떻게 수집하고 분석할 것인지 등에 대한 발표를 했다.
프레젠테이션을 준비하면서 커버로 쓸 이미지를 구글링 하다가 아래 [그림 1]의 political polarization (미국 맥락)과 관련된 이미지를 찾아서 수정 없이 그대로 발표자료의 표지로 사용했다. 이 이미지를 사용했던 이유는 정치적 편향성, 즉 개인이 가진 자신만의 정치적 이념을 좌파와 우파로 대치된 상태를 직관적으로 보여줌으로써 청자들은 이 커버 이미지를 보는 순간 정확히 무엇을 의미하는지 모르더라도 연구자가 좌파와 우파의 편향성을 다루는 연구를 하겠거니 가늠할 수 있을 것이라 기대했다. 물론 연구 제목을 이미지 중앙에 배치시킴으로써 이미지와 함께 제목을 읽으면서 청자가 충분히 연구자의 연구에 대해서 직관적으로 파악할 수 있고, 또한 무슨 이야기를 할지 궁금하게 하는 집중의 효과를 노리기도 했다.
[그림 1] 생성형 AI 알고리즘에 의한 한반도에서의 정치성 편향성 강화 현상 탐구 발표자료 커버 이미지
발표 후 커버 이미지와 관련해서 청중으로부터 어떤 질문도 받지 못했기 때문에 나는 별다른 생각없이 연구자로서 연구 저널을 작성하는 습관이 있어서 이번 콘퍼런스에 대한 참석 후기와 연구에 대한 간단한 후기를 나의 페이스북 (이하 '페북')을 통해 공유를 했다. 그런데 페북에 이 커버 이미지를 포스팅하자마자, 갑자기 내 페북 친구들의 질문이 이어졌다. '왜 프랑스 국기 이미지를 썼냐?, ' 'right wing'인데 왜 붉은색이냐?' 등등. 그 외에도 흥미로운 연구 주제라며 조금 더 자세한 설명을 해 달라는 등 예상하지 못한 뜨거운 (?) 관심에 사뭇 당황스러웠으나 이 이미지에 대해 왜 많은 사람들이 각자의 방식으로 궁금해했는지를 이해하게 되었다. 결론부터 말하자면 내 친구들이 커버 이미지에 대한 예상치못한 질문들을 한 것은 바로 내가 데이터 스토리텔링에 있어 '맥락을 구체화'하는데 실패했기 때문이다.
|데이터 스토리텔링에 있어 맥락의 중요성|
페북을 사용하고 있는 분이라면 모두 이해하시겠지만 페북에 포스팅할 때 자세하게 내 연구를 작성할 수 없었던 터라 나는 이 연구와 관련해서 어떠한 맥락 정보 없이 커버 이미지만 포스팅을 했기 때문에 나의 친구들은 그들 각자가 가지고 있는 배경지식과 경험을 가지고 이 이미지를 해석했다고 생각한다. 결과적으로 나의 친구들은 내가 의도한 데이터의 시각화와는 별개로 구체적인 맥락이 제공되지 않는 상황에서 각자가 이 표지 이미지를 해석하면서 오해하게 만든 것이다.
이렇게 데이터 스토리텔링에 있어서 맥락 정보를 구체적으로 제공하는 것은 매우 중요하다. 그래서 데이터 스토리텔러는 항상 자신이 분석한 데이터에 대한 맥락 정보를 구체화시키고, 그 맥락 정보를 각 이야기의 단계별로 어떻게 연결시킬 것이지에 대한 고민을 데이터 분석 초기부터 해야 한다. 데이터 스토리텔링에서 맥락에 대해 구체적으로 언급하는 것은 청중이 데이터를 정확하게 해석하고 그 의미를 이해할 수 있도록 하기 때문에 매우 중요하다. 또한 데이터 자체가 추상적이고 해석의 여지가 있기 때문이다. 동일한 데이터 포인트라도 어떤 맥락적 렌즈를 통해 제시되느냐에 따라 완전히 다른 이야기를 전달할 수 있다. 일반적으로 맥락은 데이터를 의미 있고 관련성 있게 만드는 데 필요한 배경과 관계를 제공한다. 맥락이 없으면 데이터는 오해되거나 그 중요성을 잃을 수 있으며, 이는 잘못된 결론이나 분석 결과에 대한 청자 혹은 독자의 무관심으로 이어질 수 있다.
내 연구로 돌아와서 맥락 정보를 구체화한다면 어떻게 해야 할까? 이 연구는 '(영토) 분단된 지 70년이 넘은 한반도에서는 이미 정치적 편향(좌파 대 우파) 성이 극대화될 수밖에 없는 사회, 문화, 정치적 구조를 잉태하고 있다는 점에서 맥락 정보로써 남북한의 독특한 정치적, 문화적, 사회적 환경에 대한 정보를 제공해야 할 것이다. 특히 한반도의 분단은 냉전의 유산이자, Immanuel Wallerstein 등이 주장하는 주변국의 노동력과 원자재를 지배, 착취해 온 세계체제 (World System)가 복합적으로 뒤섞여 있는 현재 시점에서 세계 유일의 이념적, 경제적, 정치적 분단의 속성을 가졌다. 그래서 한반도의 분단과 통일에 대한 주제를 연구하는 연구자들은 이러한 분단 맥락을 구체적이면서도 조심스럽게 접근해야 한다.
이번 연구의 경우 나는 분단의 역사적, 정치적 배경을 설명하고 이러한 요인들이 생성형 AI 알고리즘을 통해 이러한 데이터가 어떻게 학습되고, 그 결과 어떻게 정치적 편향이 형성 혹은 강화되는지 체계적으로 밝힘으로써, 문제의 진정한 근원을 분석할 수 있을 것으로 기대한다. 특히 각각 다른 알고리즘을 가진 세 가지 대표적인 생성형 AI 툴-- 'ChatGPT 4-o, Claude 3.0-opus, Gemini Advanced'--의 프롬프트 결과를 분석할 때, 이 알고리즘 모델들이 주로 서구 민주주의 국가의 데이터로 학습되었고 그러한 정치적 성향을 반영할 수 있다는 맥락을 고려하는 것이 중요하며, 그것이 현재 대한민국의 정치 현실을 해석하는데 영향을 미칠 수 있다는 것을 언급해야 한다. 이러한 맥락을 사전에 설정하는 것은 위의 예시로 든 생성형 AI 알고리즘 모델들과 한반도의 정치적 편향이 다른 서구 민주주의 국가들과 어떤 차이를 보이는지에 집중하는 것은 데이터를 해석할 때 결정적일 것이기 때문에 데이터 분석과 스토리 설계에 있어서 매우 중요하다고 생각한다.
|Gustav Freytag's (1863) Technique of Drama|
[그림 2] Freytag's 피라미드 이렇게 구체화된 맥락을 제공하면 구조화된 내러티브의 각 단계에서 청중이 데이터를 어떻게 인식하는지 전략적으로 통제할 수 있다. 관련해서 최근 데이터 스토리의 내러티브 구조에 대한 연구가 많이 증가하고 있다. 여러 가지 연구에 대해서는 고전적인 내러티브 구조 및 이론인, 아리스토텔레스의 비극 6요소 (Aristotelian Tragedy)나 Joseph Campbell's (1948) hero analysis (The Hero with a Thousand Faces) 등 많은 연구들이 있으나 자세한 내용은 이후 챕터부터 천천히 살펴보고, 이번 챕터에서는 Gustav Freytag's (1863) Technique of Drama 혹은 내러티브의 전개 과정이 피라미드와 비슷하게 생겨서 Freytag의 피라미드라고 불리는 내용을 '맥락의 구체화'라는 측면에서 먼저 살펴보겠다.
최근 몇 년 동안 데이터 시각화 측면에서 Freytag의 피라미드의 사용 가능성과 데이터 스토리텔링의 변형에 대해 적극적으로 연구되고 있다 (Yang et al., 2021). Freytag의 피라미드는 영화와 문학에 널리 적용되어 온 고전적인 서사 구조인데, 이는 발단 (context), 상승 행동, 절정, 하강 행동, 결말을 포함하는 내러티브 구조로, 데이터를 조직하고 제시하는 데 있어 이해와 참여를 구축하는 프레임워크를 제공한다. 여기에서 맥락의 구체화는 바로 모든 이야기의 발단, 즉 초기 설정과 관련된다. 이 초기 설정은 이후 데이터 통찰과 내러티브 흐름을 이해하는 데 필요한 맥락을 제공하기 때문에 매우 중요하다. 청중 혹은 독자에게 핵심 배경 정보를 제공하고, 상황을 세팅하며, 캐릭터의 성격을 규정하는 단계에 해당된다. 이렇게 배경 설정이 끝나면 상승 행동과 절정은 핵심 통찰력으로 이끌며, 하강 행동과 결말은 핵심 메시지를 강화하는데 초점을 맞추게 된다. 따라서 이 단계는 이야기에 대한 관문 역할을 하여 청중의 관심을 끌고 데이터를 의미 있는 맥락 내에서 프레임화할 수 있게 돕는다.
|번외: 맥락을 알면 이 기업의 주식이 왜 떨어지는지 알 수 있다?|
아래 그림은 스타벅스 (이하 '스벅')의 2018년 9월 30일부터 2023년 10월 1일까지의 총 수익률을 스벅 자체 데이터와 함께 S&P 500 지수, 나스닥 종합 지수 및 S&P 500 소비자 재량 부문 성과와 비교하여 나타낸 것이다. 그래프에 표시된 모든 지수는 2018년 9월 30일을 기준으로 100으로 재설정되었으며, 해당 날짜에 100달러를 투자하고 해당 날짜 이후 지급된 배당금을 재투자한다고 가정한다. 이 보고서를 읽다 보면 그래프 하단에 '그래프에 표시된 주가 성과가 반드시 미래 주가 성과를 나타내는 것은 아닙니다.'라고 조심스러운 언급이 있다. 안타깝게도 말이 씨가 된 건가? 최근 스벅의 주가는 크게 하락했다. 스벅의 주가 하락과 관련된 맥락 정보를 데이터 스토리텔링 측면에서 살펴보면서 이번 챕터를 마무리하고자 한다.
(Source: Starbucks Fiscal 2023 Annual Report, p. 26)
스벅의 현 CEO는 인도계 미국인인 랙스먼 내러시먼 (Laxman Narasimhan)이 맡고 있다. 스벅은 2020년 Covid-19 팬데믹으로 인해 엄청난 영업손실을 입은 이후, 2022년 창업자이자 임시 CEO 인 하워드 슐츠가 많은 후보들 중 랙스먼을 점찍어 선임함으로써 향후 인도 시장에서의 스벅의 입지를 굳히고자 하는 의지를 보였으나 (스벅은 신임 CEO를 누구를 선임하는지를 보면 향후 스벅의 비즈니스 전략을 엿볼 수 있는 것 같다!) 올해 1분기 매출(동일 매장 기준)이 작년 동기보다 4% 줄어드는 등 시장의 예상치에 크게 못 미치는 실적을 냈다.
특히 가장 큰 시장인 미국과 중국에서 매출이 각각 3%, 11% 감소했고, 설상가상으로 스벅은 가자 지구 분쟁에서 이스라엘을 지지하고 이스라엘 정부와 이스라엘 군에 자금을 댄다는 루머가 퍼지면서 불매 운동의 직격탄을 맞았다. 스벅 측은 오해 때문에 불매 운동의 타깃이 됐다고 해명하였으나 이미 기업의 이미지는 추락했고, 이를 회복하기 위해서는 스벅 측의 상당한 노력이 필요해 보인다. 역시나 하워드 슐츠가 다시 등판해서 상황을 추스르고 있으나 현재로서는 그의 노력이 얼마나 실효성을 거둘 수 있을지 미지수이다.
|나오며|
오늘 설명한 맥락의 구체화가 왜 데이터 스토리텔링에 있어서 중요한지 이해가 되셨기를 바란다. 이번 장을 요약하면 맥락 정보를 구체적으로 제공한다는 것은 데이터를 의미 있고 관련성 있게 만드는 내러티브 구조의 일부로 데이터를 정확하게 해석하는데 영향을 미친다는 점에서 데이터 스토리텔링에서 필수적이다. 명확한 맥락이 없으면 데이터를 오해하거나 중요성을 잃어 잘못된 결론에 이를 수 있다. 맥락은 다음과 같은 이유로 중요하다.
관계 명확화: 다양한 데이터 포인트 간의 관계를 이해하는 데 도움을 주어 정확한 결론을 도출하기 쉽게 만든다.
참여도 향상: 잘 정의된 맥락은 이야기를 더 흥미롭고 관련성 있게 만들어 청중과 독자의 관심을 유발 또는 유지시킨다.
관련성 제공: 맥락은 데이터가 청중에게 관련성이 있도록 하여 데이터 분석 및 해석에 있어 통찰력을 이끈다.
오해 방지: 명확한 배경정보를 제공함으로써 오해를 방지하고 데이터를 올바르게 이해할 수 있도록 돕는다.
|더 읽을 자료|
1. Delgado. (1989). Storytelling for Oppositionists and Others: A Plea for Narrative. Michigan Law Review., 87(8), 2411–2441. https://doi.org/info:doi/
2. Hinton, A. (2014). Understanding context: Environment, language, and information architecture. O'Reilly Media, Inc.
3. Yang, L., Xu, X., Lan, X., Liu, Z., Guo, S., Shi, Y.,... & Cao, N. (2021). A design space for applying the freytag's pyramid structure to data stories. IEEE Transactions on Visualization and Computer Graphics, 28(1), 922-932.