brunch

You can make anything
by writing

C.S.Lewis

by 알렉스 Apr 22. 2021

PT 일기에 대한 텍스트 분석

나는 무척 진지하다

<요약>
pxd의 이재용 대표님이 연재하는 PT 에피소드를 분석하였고, 각 에피소드는 운동을 회피하려는 시도와 이를 제압하는 PT 선생님 간의 대화로 이루어진 “도전과 제압”을 기본 구조로 하며 대화의 전개 과정에서 드러나는 어리숙함을 통해 웃음을 유발하고 있음을 밝혔다.

또한 종된 화자(sub-speaker)의 주 사용단어를 의미 기준으로 파악하고 이를 통해 직업적 특성이 발화 내용에 드러나는지 확인하였다. 




지난 4월 이후 연재 중이며 다수의 애독자를 양산하고 있는 pxd 이재용 대표님의 『PT일기』를 대상으로 텍스트 분석을 수행하여, 독자들에게 큰 즐거움을 선사하는 웃음 포인트를 밝히고 조금이라도 운동을 덜 하고자 안간힘을 쓰는 회원님의 건강을 위해 PT선생님이 얼마나 노력하는지 정량적인 증거를 제시 하고자 한다. 



1. 분석 대상 


2015년 4월부터 8월까지 이재용 대표님의 페이스북을 통해 게시된 총 21개 에피소드를 대상으로 한다. (PT일기는 그 이후로 쭉 계속 되고 있다.)



2. 정량분석-대화량분석 


총 21회에 걸쳐 대화가 이루어졌고 129개의 문장을 포함한다. 



화자(Speaker)별 대화 점유율을 확인하면 다음과 같다. 


이재용 대표님은 총 65개의 문장을 말했고, 이는 447 단어 (1,645글자) 로 구성된다.   


PT 선생님은 총 64개의 문장을 말했고, 이는 412 단어 (1,496글자) 로 구성된다.            


※상기 표의 “ME”는 이재용 대표님을 지칭한다. 이후 본 문서에서 동일한 표현을 반복 사용한다.



각 문장을 구성하는 단어의 길이는 1자에서 7자 사이로 평이한 수준이다. 따라서 발화 점유율 또한 단 어를 기준으로 계산하는 경우와 글자수를 기준으로 계산하는 경우가 거의 유사하게 나타난다.


정량적인 대화량은 두 화자가 큰 차이를 보이지 않으며, 이재용 대표님이 약간 우세하다(2% 내외). 이 는 이재용 대표님의 독백이 포함되어 있는 일부 에피소드의 영향인 것으로 보인다. 



각 에피소드는 2개에서 14개의 문장으로 구성되며, 에피소드 당 평균 문장 개수는 6.14개 이다. 



전체 21회 대화 중 12회(57.1%)가 5개 이하의 문장으로 구성된 짧은 대화이다. (참고: [graph #1. 에피소드 분포 – 구성 문장의 개수 기준])   


당초 에피소드의 특성 상, 운동을 목적으로 방문한 체육 시설에서 나눈 짤막한 대화를 기록하였기 때문에 5개 이하의 적은 수로 각 에피소드가 구성된 점은 자연스러운 현상으로 본다. (참고: [graph #1. 에피소드 분포 – 구성 문장의 개수 기준])


에피소드 당 문장 개수는 편차가 큰 편이나, 시간이 흐름에 따라 에피소드 당 문장 개수가 늘 어나거나 줄어드는 패턴은 보이지 않는다. 즉, 에피소드 생성 시점이나 기록 시점, 기간의 경 과에 따른 영향은 없는 것으로 보인다. (참고: graph #2. 에피소드별 문장 갯수 – 작성일 순서)           




3. 대화 시퀀스 분석 



주 화자 “ME”와 종 화자 “PT” 간에 이루어진 대화의 기본 골격은 [발제 문장]-[응대 문장] 구조이다. 


A형 대화는 종 화자(PT)의 발제에 이어 주 화자(ME)가 응대 하는 순서이고, B형 대화는 주 화자(ME) 의 발제에 이어 종 화자(PT)가 응대 하는 순서이다. 



위의 형식을 사용하여 A형 대화와 B형 대화를 다시 기록하면 아래와 같다. 



21개의 에피소드를 상기와 같이 분석한 결과, 


종 화자 PT의 발제에 대해 주 화자 ME가 도전을 시도한 후 종 화자 PT가 제압하는 시퀀스가 가장 높은 비율을 차지했다. (총 9회) 


종 화자 PT의 지시나 발제에 주 화자 ME가 독백을 하거나 재해석하는 시퀀스는 총 7회 등장했다. 


주 화자 ME의 질문에 종 화자 PT가 대답하고, 주 화자 ME가 이를 재해석 하는 시퀀스는 총 3회 등장했다.               

기타 주 화자 ME의 독백으로 이루어진 에피소드 등이 존재한다.   




주 화자는 상기한 3 가지 시퀀스를 반복 활용하여 대화를 구성함으로써, 독자의 웃음을 안정적으로 확 보한다. 각 시퀀스가 웃음으로 귀결되는 구조는 다음과 같다. 



  도전과 제압: PT의 운동 지시에 도전(운동 회피 시도)했다가 단칼에 제압당하고 회피 시도를 철회하는 과정을 보여줌으로써, 어설픔을 유머 코드로 어필한다.   


  대화와 재해석: PT의 발제 내용을 개인화 함으로써 PT의 발제 내용을 뒤집거나 혹은 운동을 할 수 밖에 없는 현실을 자조/자위하는 내용으로 재해석 한다. 독자는 ME의 자조적인 독백에 서 재미를 얻기도 하지만, “도전과 제압”과는 달리 주 화자 ME의 새로운 해석에서 명석함을 확인하기도 한다.   


 질문과 제압: PT에게 준비된 질문(운동 회피 시도)을 던졌다가 쉽게 제압 당하는 경우와 순수 하게 궁금함을 해결하기 위한 질문을 던지고 그 대답을 재해석 하는 경우로 나뉜다. 앞의 경 우는 “도전과 제압”의 변이로 볼 수 있다.             



4. 형태소 분석             


종 화자 PT는 체력 단련 시설의 트레이너로서 운동을 가급적 적게 하고자 하는 회원들을 독려하고 운 동량을 늘리기 위해 다양한 화법을 사용하고 있다. 본 분석의 마지막 파트로 종 화자 PT의 발화 내용 에 대한 형태소 분석을 실시하고자 한다.             


종 화자 PT는 총 64개 문장을 말했고, 이는 391개의 단어에 해당한다. 이 중 전체 문장을 통해 1회 이상 등장한 단어는 31종, 163개 에 이른다.             

 


글자의 크기는 출현 빈도를 상대적으로 나타낸다.   

진한 파란색으로 표현한 단어는 단어의 군집을 나타낸다. 이는 구체적인 표현들을 포괄하는 대표 표현으로 표기한 것이다. 예) 지시어: 이리, 이건, 이렇게 등을 포괄   

옅은 파란색으로 표현한 단어는 문장 중에 실제 해당 단어가 동일하게 사용된 경우이다. 



종 화자 PT의 표현 중 특기할 사항은 다음와 같다.   


종 화자 PT가 가장 많이 사용한 구체적인 표현은 “운동”이다.(2회 이상 빈출 단어 163개 중 14회, 9%)   

 신체 부위를 지칭하는 표현과 정량적인 표현(무게, 체중, 횟수 등)을 매우 높은 빈도로 사용하 고 있다. (17%)   

재미있는 것은 “더” 라는 표현을 8회(5%)나 사용하고 있는 점이고, 운동을 지시 하는 표현(하 세요, 해보세요, 시작하세요) 또한 다수 사용하였다. (9%)   

기타 체육 시설과 관련된 표현과 긍정적인 감정 표현(웃음)도 다수 발견되었다. (13%)

 

이를 종합하면,PT의 발화 중 2회 이상 빈출 단어 163개 중 48%에 해당하는 78개의 단어가 운동을 독려하고 지시하고 목표를 제시하고 긍정적인 감정을 전달하는데 사용되고 있음을 알 수 있다. 


PT가 회원의 운동 회피 시도를 긍정적인 방식으로 제압하기 위해 노련하게 화술을 전개하고 있다는 사실 또한 짐작할 수 있다. 



5. 이후 분석 


금번 분석은 대화량에 대한 정량적 분석과 대화를 구성하는 문장의 역할을 정성적으로 분석한 시퀀스 분석, 그리고 PT의 발화에 대한 의미소 분석에 중점을 두었다. 


대화량의 정량 분석 과정 중 시간의 흐름이나 대화 작성 시간이 문장 개수에 영향을 미치지 않음은 확인하였으나, 대화의 내용이나 주/종 화자의 감정이 대화량(문장 개수)에 영향을 미칠 것으로 추측된다. 향후 이 부분을 더 살펴보면 재미있는 결론에 도달 할 것으로 보인다. 


<끝> 






작가의 이전글 데이터 분석 오픈챗방 이야기

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari