내가 토종 한국인으로서 영어를 하면, '튜링테스트(Turing Test)'에 통과해야 하는 AI가 된 기분이다. 튜링테스트는 대화 상대를 가려놓고, 그 상대가 사람인지 AI인지 구분할 수 있는지 확인하는 테스트다. 한국인도 영어를 할 때마다 자신이 영어 원어민이 아닌 걸 들킬까 하는 두려움에 빠진다. 영어 공부를 위한 유튜브 썸네일은 "절대 이렇게 말하면 안 된다"며 겁주는 문구로 가득하다. '콩글리쉬'를 구사할까 봐 전전긍긍하고, 할리우드 영화에서 듣던 발음이 아니면 비웃는다.
어렸을 때 자주 하던 딕테이션은 영어를 듣고 모든 단어를 정확하게 받아 적는 숙제였다. 실력 향상에는 도움이 되었겠지만, 실생활의 영어는 딕테이션이 아니다. 생각해 보면 모국어인 한국어도 모든 단어를 100% 정확히 들으며 살고 있지 않다. 손님들로 가득 찬 카페에서 수다를 떨다 보면 시끄러워서 서로의 말이 잘 안 들리기도 하고, 생소한 주제의 이야기를 나누면 모르는 단어가 많아서 이해를 못 하기도 한다. 그렇다고 그 순간 모든 대화가 끝나고 관계가 단절되는 것도 아니다. 단어 하나 못 듣는다고 큰일 나는 경우는 없는데, 딕테이션 숙제를 열심히 하던 습관, 영어 리스닝 문제를 하나라도 더 맞혀야 했던 그 간절함을 잊지 못하고 상대가 영어로 말하기 시작하면 굳어버린다. 못 들었거나 이해하지 못하는 단어가 나오면 다시 물어보면 된다. 그건 부정행위도 아니고 대화의 일부분이다.
영어 발음도 단 하나의 정답이 있는 것처럼 배웠다. '지도학습(Supervised learning)'은 AI에게 단 하나의 바람직한 정답을 주고 그 정답을 정확히 맞히도록 학습하는 방식이다. 반면 '비지도학습(Unsupervised learning)'은 정답 데이터 없이 AI를 학습하는 방식으로, 유사한 데이터끼리 하나의 그룹으로 묶는 '클러스터링(Clustering)' 방식이 가장 대표적이다. 예전엔 미국식 발음만을 정답으로 보고 지도학습을 했다. 나머지 발음은 오답이니 어서 빨리 그 오답으로부터 멀리 떨어지는 것이 상책이었다. 요즘엔 '악센트(Accent)'라는 단어가 많이 쓰이는 덕분에 내 발음도 오답이 아니라고 느껴진다. 이 세상엔 다양한 악센트가 있고 이들을 비지도학습으로 클러스터링 할 수 있다. 한국인의 영어 악센트는 오답이 아니라, 여러 클러스터 중 하나일 뿐이다. 우열이 아닌 다양성이다.
Thumbnail Image by Clara Scherer on Dupe