사족 ― 언어의 속도 한계

문자의 역사, 권외2

by CCCV 츠스쿠

전주곡

人人生而自由、在尊严和权利上一律平等。
他们赋有理性和良心、并应以兄弟关系的精神相对待。
(중국어, 39음절)
All human beings are born free and equal in dignity and rights.
They are endowed with reason and conscience and should act towards one another in a spirit of brotherhood.
(영어, 44음절)
모든 인간은 태어날 때부터 자유로우며 그 존엄과 권리에 있어 동등하다.
인간은 천부적으로 이성과 양심을 부여받았으며 서로 형제애의 정신으로 행동하여야 한다.
(한국어, 66음절)
すべての人間は、生まれながらにして自由であり、かつ、尊厳と権利と について平等である。
人間は、理性と良心とを授けられており、互いに同胞の精神をもって行動しなければならない。
(일본어, 100음절)

위의 네 지문은 모두 세계 인권 선언의 제1조랍니다. 똑같은 내용인데도 네 언어의 음절 수가 크게 차이 나는 것을 볼 수 있죠. 왜 그런 걸까요?


거기에다가, 네 언어의 원어민 화자를 여러 명 불러 각자 저 글을 읽게 한 뒤 평균 낭독 속도를 측정하면, 네 언어의 낭독 속도는 크게 차이 나지만, 정작 다 낭독하는데 걸리는 시간은 비슷할 거랍니다. 정말로 왜 그런 걸까요?


먼저 음절 수의 차이를 봅시다. 음절의 수는 정보를 전달하기 위해서 입을 얼마나 움직여야 하는지를 나타내는 부정확한 수치죠. 이는 당연하게도, 음절이란 것이 확고하게 정해진 것이 아니기 때문이랍니다. 음절이 왜 모호한 개념인지는 이전 장을 참고해 주세요.


각설하고, 음절 수가 믿음직한 지표는 아니긴 하지만, 일단은 동일한 정보를 전달하기 위해서 중국어가 가장 말을 적게 해도 되고, 영어와 한국어가 그다음이고, 일본어가 가장 말을 많이 해야 한다는 것입니다.


그렇다면 각 음절에 담기는 정보의 양은 일본어가 가장 적고, 한국어와 영어가 그다음이고, 중국어가 가장 많다는 뜻이겠죠. 정보의 총합은 같으니까요.


그런데, 전부 낭독하는데 걸리는 시간도 비슷하지 않았나요? 전체 걸리는 시간은 같은데, 말해야 하는 음절의 수가 많거나 적다면 각 음절을 말하는 속도가 빠르거나 느려야 한다는 말이겠네요.


즉, 음절당 담기는 정보의 양이 적을수록, 음절당 말하는데 걸리는 속도는 빠르고, 정보의 양이 많으면 속도는 느리다는 말이겠네요. 따라서 시간당 정보 전달량은 언어에 상관없이 동일하고요.


왜 이런 걸까요? 사고 실험을 하나 해봅시다. 만약 한 마디 한 마디에 정보를 욱여넣어서, 한 마디 말로 다른 언어는 열 마디에 달하는 정보에 전달할 수 있다면 훨씬 유리하지 않을까요? 정보를 빠르게 전달한다고 불리할 건 없으니까요. 이 언어를 갑자어라고 해봅시다.


반대로 다른 언어에서는 한 마디 말로 해도 되는 것을 열 마디 말로 해야 하는 언어도 있을 수 있겠죠. 이 언어는 계해어라고 해봅시다.


세상에서 가장 빠르고, 가장 짧은 언어 갑자어와 세상에서 가장 느리고, 가장 긴 언어 계해어가 있다면 여러분은 어떤 언어를 쓰고 싶나요? 아마 갑자어가 더 좋아 보이지 않나요? 그럼 전 세계 모든 언어는 갑자어와 비슷해지는, 더 빨라지는 방향으로 가지 않을까요?


그런데도 모든 언어의 시간당 정보 전달량이 비슷하단 말은 모든 언어가 빨라질 대로 빨라져서, 더 빨라질 수 없다는 얘기겠죠. 즉, 현대의 모든 언어는 인간 인지 속도를 한계까지 밀어붙인 언어라는 뜻입니다.


정말 그런 걸까요? 오늘의 주제는 언어의 정보 밀도에 관한 이 논문이랍니다.

(※ 아래의 번역 및 요약은 제 해석이기에, 실수나 오류가 발생할 수 있습니다. 이 점 유의하시고 읽어주셨으면 합니다.)


1악장 — 지금까지 알고 있는 것

일본어는 세계에서 널리 쓰이는 언어 중에서 가장 음절의 가짓수가 적은 축에 속하는 언어의 대표주자랍니다. 제한이 심한 음운 배열이 그 이유죠. 얼마나 음절 수가 적은지, 세계의 언어 중에서 거의 유일하게 음절문자를 쓰면서, 오십 자로 어떻게든 틀어막을 수 있는 정도랍니다.


반대로, 세계에서 널리 쓰이는 언어 중 가장 복잡한 음절 구조를 가진 언어인 영어를 봅시다. 영어는 일본어와 반대로 음절 구조에 제약이 거의 없죠. 영어처럼 자음 서너 개를 연달아 말하는 것이 평범한 언어는 많지 않답니다. 그것도 이렇게 널리 쓰이는 언어 중에서는요. 심지어 영어는 이론상 자음을 다섯 개까지 연달아 발음할 수 있죠. 바로 angsts랍니다. 이론상 /ænksts/[앵ㅋㅅㅌㅅ]로 발음할 수 있지만, 평범하게 말할 때는 안 그러죠.


영어에서는 두음에 최대 세 자음, 말음에는 최대 네 자음까지 올 수 있답니다. 또한, 영어는 자음군의 제한이 굉장히 널널하기 때문에 수많은 음절이 가능하죠. 자세한 개수를 세는 것은 좀 복잡하지만, 대략 7000개 가량이 있다고 합니다. 일본어는 몇백 개가 있다고 하죠.


즉, 언어에 따라 음절의 가짓수는 자릿수 차이가 날 정도로 차이가 크답니다. 그런데 언어마다 단어의 수는 차이 나지 않으니(적어도 일상생활에서 쓰이는 단어의 수는 거의 비슷하죠), 한 단어에 들어가는 음절의 수가 달라야겠네요.


이론적으로 보았을 때, 음절의 가짓수가 100가지라면 두 음절짜리 단어 10000개를 만들 수 있지만, 음절의 가짓수가 10가지라면 10000개의 단어를 만들기 위해 네 음절을 써야 하니까요. 극단적인 예시로, 한국어의 1인칭 대명사 "나"와 일본어의 1인칭 대명사 "わたし"[와타시]를 비교하면 음절의 수가 3배나 차이 나는 것을 볼 수 있습니다.


그런데 알아보고 싶은 것은 왜 각 단어당 음절의 수가 이렇게 차이 나는데도 언어를 불문하고 같은 문장을 읽는데 걸리는 시간이 비슷한 이유랍니다. 그러니 음절당 말하는데 걸리는 속도, 즉 발화 속도speech rate(이하 화속SR)를 측정해 봐야겠습니다.


또한, 각 언어는 언어 제1의 목적, 소통에 최적화 되었을 테니, 각 언어는 정보를 전달하는 속도가 이미 최적화되었을 겁니다. 그러니 정보 속도information rate(이하 정속IR)도 측정해 봐야겠네요.


2악장 — 실험 기준

먼저, 실험에 쓰일 언어를 골라봅시다. 다양한 음절 수, 다양한 음운 수, 다양한 문화·사회·역사적 배경을 가진 언어들을, 여러 어족에서 고루 뽑아야 하겠죠? 연구자들은 이런 목적을 가지고 다음의 17개 언어를 실험 대상으로 삼았답니다.

바스크어족: 바스크어(EUS)

오스트로아시아어족: 베트남어(VIE)

우랄어족: 핀란드어(FIN), 헝가리어(HUN)

인도유럽어족: 독일어(DEU), 세르보크로아트어(SRP), 스페인어(SPA), 영어(ENG), 이탈리아어(ITA), 카탈루냐어(CAT), 프랑스어(FRA)

일본어족: 일본어(JPN)

중국티베트어족: 광동어(YUE), 표준 중국어(CMN)

크라다이어족: 태국어(THA)

튀르크어족: 터키어(TUR)

한국어족: 한국어(KOR)

그리고, 이들 언어의 원어민 화자를 10명씩 모은 170명이 이번 실험의 참가자랍니다. 참가자는 총 15개의 지문을 읽어야 하는데요, 각 언어로 된 지문은 의미상으로 거의 비슷하고, 15지문의 음절 수를 합치면 대략 240,000음절이랍니다.


이때, 음절을 어떻게 셌는지가 중요합니다. 한국어를 예시로 들면, "바뀌어"라는 말을 할 때, 많은 사람들이 일상에서는 /pa.k̚ɥʌ̹/([바껴]와 비슷)에 가깝게 소리를 내는 것이 있죠. "바뀌어"는 세 음절이지만, /pa.k̚ɥʌ̹/는 두 음절이랍니다. 연구자들은 사전상의 음절 수로, 이 경우에는 세 음절로 셌다고 합니다. 이렇게 센 글자의 총 음절 수(이하 절수NS)가 측정의 기준이 된답니다.


마침 절수의 기준을 정했으니, 화속과 정속의 기준도 정해봅시다. 먼저, 화속의 기준입니다. 화속을 셀 때 "말의 빠르기"를 측정해야 하는데, 마땅한 기준이 없으니 부정확한 절수를 바탕으로 측정해야 합니다. 각 화자의 음절 수를 정확히 다 셀 수 있다면 좋았겠지만, 그건 거의 불가능하니까요. 즉, 절수를 낭독하는데 걸린 총 시간으로 나눈 것이 화속이랍니다(단위는 음절/초).


이때 각 화자가 평범하게 "읽는" 경우나 "말하는" 경우가 아닌, "낭독하는" 경우를 기준으로 정한 것도 유념해야 합니다. 낭독을 기준으로 한 것은 화자 간의 차이를 최대한 줄이고, 모든 화자의 화속을 최대한 비슷하게 만들기 위한 것이랍니다.


정속을 정하기 위해서는 정보의 양을 구해야겠죠. 그런데, 각 소리, 이 연구에서는 음절을 중심으로 삼고 있으니, 각 음절의 정보량을 측정하는 방법을 알아내야 정속을 구할 수 있지 않을까요? 그렇다면 정보량을 측정하는 방법을 찾아야겠네요.


이번 실험에서는 정보의 양을 구하는 데 간접적인 방법을 썼답니다. 예시를 통해 알아봅시다. "나"라는 음절 다음에는 "는"이라는 음절이 올 가능성이 높습니다. "습"이라는 음절 다음에는 "니다"라는 두 음절이 올 가능성이 높죠. 그런데, "하" 뒤에는 무슨 음절이 올까요? "호" 뒤에는요? 추측하기도 힘듭니다.


"나"나 "습" 같은 음절은 이 음절만으로 뒤에 올 음절을 알 수 있을 정도니, 이 음절 하나가 담는 정보의 양이 적다고 할 수 있답니다. 뒤에 오는 음절을 "알" 수 있는데 어떻게 정보량이 적은지 궁금하시다면, "안다"라고 여기기 보다는 "당연하다"라고 여기면 된답니다. 마치 "내일은 해가 뜰 것이다"라는 문장보다는 "내일은 비가 올 것이다"라는 문장이 더 유용한 것처럼요.


그런데 "하"나 "호" 같은 음절은 뒤에 무엇이 올지 감을 잡을 수 없습니다. 마치 "지금부터 해서 첫 번째로 본 고양이는 검은색일 것이다" 같은 문장처럼, 하나도 당연하지 않고 한 음절 자체로 의미를 담고 있죠. 그러니 이런 음절의 정보량은 많답니다. 즉, 뒤에 무엇이 올지 예상하기 힘든 것은 정보량이 많은 것이죠.


같은 단어 안이라는 제한 안에서, 뒤에 올 수 있는 음절의 가짓수가 둘이라면, 그 음절의 정보량을 1비트라고 해봅시다. 6비트짜리 음절이면, 뒤에 64가지의 음절이 올 수 있는 것이죠. 그리고 수많은 단어의 수많은 음절을 따져 봐 실제로 각 음절마다 뒤에 몇 가지의 음절이 올 수 있는지 센 다음 각 음절의 비트를 재고, 음절 당 비트의 평균을 내어 각 언어의 정보 밀도information density(이하 정밀ID)을 구할 수 있답니다.


마지막으로, 정밀과 화속을 곱하면 정속이 나오죠. 수식으로 쓰면 "비트/음절 × 음절/초 = 비트/초"가 되어 정밀과 화속을 곱해서 정속을 구하는 것이 맞는 방법임을 알 수 있습니다. 그러면 이제 실험을 하고 결과를 계산할 차례인데, 그건 여기선 중요하지 않으니 건너뛰고, 후주곡에서 이 연구의 결론을 다루고 마칩시다.


후주곡

이 실험의 결론은, 전주곡에서 다룬 것처럼, 언어마다 말하는 속도(화속)의 차이는 있을지라도, 각 언어의 정보 밀도가 다르기 때문에, 정확히는 정밀이 화속에 반비례하기 때문에 정보를 전달하는 속도(정속)의 차이는 거의 없다는 것이랍니다. 물론, 연구의 자료 1과 2(Fig. 1, 2)에서도 보이는 것처럼 화속과 정속에 어느 정도의 상관관계는 있답니다. 하지만 언어마다 크게 차이 나는 화속에 비해 정속은 엇비슷한 것을 볼 수 있죠. 이는 자료 3을 통해 알 수 있답니다.


더 정밀한 실험이 필요하겠지만, 결론은 단순하답니다. 인간의 언어는 정보 전달에 최적화 되어 있습니다. 언어를 불문하고 인간의 뇌는 똑같기 때문이죠.

이전 08화사족 ― 음절