우리는 구분하지 못하는 소리, 아이들은 들을 수 있다
아직 언어를 배우지 않은 신생아가 말의 의미를 파악할 수는 없으니, 아이들과의 의사소통은 언제나 큰 숙제입니다. 일반적으로 아이들의 언어 능력은 성장 과정에서 계속 발달한다고 알려져 있죠. 하지만 갓 태어난 아이들이 성인보다 훨씬 탁월하게 발휘할 수 있는 능력도 있습니다. 바로 말소리를 구분하는 능력인 음소지각능력입니다. 하지만 이 능력은 생후 1년 이내에 아주 빠른 속도로 소실되기 시작합니다. 음소지각능력이 추후 언어를 배우고 사용하는 것에 어떤 영향을 미치는지, 그리고 이것이 소실되지 않으려면 어떻게 해야 하는지 두 차례의 포스팅을 통해 알아보겠습니다.
인간이 서로 다른 말소리를 구분하는 것은 말의 앞뒤 맥락이나 발화자의 어조 등 여러 가지 요소를 함께 고려한 결과입니다. 하지만 말의 의미를 파악할 수 없는 영아에게 말소리를 구분하기 위해 가장 주요하게 사용되는 요소는 *VOT라고 부르는 성대진동 시작 시간(voice onset time)입니다. 성대진동 시작 시간은 음향음성학에서 주로 유성음과 무성음을 판단하기 위해 쓰는 개념인데요, 파열음의 개방과 성대의 울림 사이의 시간, 쉽게 말해 자음을 발음하고 나서 모음을 발음하기까지 걸리는 시간을 말합니다.
*VOT의 개념에 대해서는 간단히만 알고 계셔도 오늘의 포스팅을 이해할 수 있으니, 걱정 말고 따라와주세요!
사실 인간의 말소리는 명확한 경계가 없이 연속적입니다. 그럼에도 우리는 말소리를 듣고 명확한 경계가 있다고 인식하는데, 이것은 우리가 말소리를 구분하는 임의적인 카테고리를 가지고 있기 때문입니다.
실제 예시를 들어서 설명해볼까요? 영어와 한국어는 모두 [b = ㅂ]와 [p = ㅍ]의 말소리를 구분하는 언어 체계를 가지고 있습니다. 위 그림은 우리가 [b]와 [p] 소리를 구분하는 방식을 나타낸 것입니다. 원래 [b]와 [p] 두 소리는 무 자르듯 구분되지 않고 연속적이지만, 우리는 VOT의 수치를 기준으로 삼아 연속적인 소리들을 대략적인 카테고리로 구분하게 됩니다. 보통 [b], [p] 발음이 모두 존재하는 언어 체계에서는 VOT가 0~30ms인 구간의 소리는 [b]라고 인식하고, VOT가 30ms 이상인 구간의 소리는 [p]라고 인식합니다. 연속적인 소리를 VOT 30ms를 기준으로 [b]와 [p] 두 가지 카테고리로 구분하는 것이죠.
그렇다면 VOT 30ms 이하의 소리는 모두 동일하게 들릴까요? 그렇지 않습니다. VOT 10ms인 소리는 VOT 20ms인 소리와 같은 [b] 카테고리에 있음에도 조금 더 힘 없는 [b]소리라고 인식하게 됩니다. VOT 30ms 이상인 소리도 마찬가지로, VOT 60ms인 소리는 VOT 70ms인 소리보다 조금 더 힘 없는 [p] 소리라고 인식하게 됩니다.
정리해보겠습니다. VOT 30ms를 기준으로 소리는 [b]와 [p] 카테고리로 구분되지만, 같은 카테고리 안에서도 VOT 수치에 따라 소리의 차이가 존재합니다. 하지만 인간은 소리의 카테고리 경계는 쉽게 구분할 수 있는 반면, 한 카테고리 안에 있는 소리들의 차이를 구분하기는 매우 어렵습니다. 다시 말해 [b]와 [p]를 구분하는 것은 쉽지만, 같은 [b] 카테고리에 있는 VOT 10ms 소리와 VOT 20ms 소리가 서로 다르다는 점을 인식하기는 어려운 것이죠.
하지만 태어난 직후의 신생아들은
음소지각능력이 그대로 보존된 상태로,
같은 카테고리 내의 소리들도 쉽게 구분해냅니다.
성인 화자의 경우 이 소리를 VOT 30ms 이하인 구간과 30ms 이상인 구간, 즉 두 가지로 구분하지만 아직 언어 체계가 잡히지 않은 영아들의 경우 이 구간을 훨씬 세분화하여 소리를 구분할 수 있습니다. 하지만 발달 과정에서 하나의 언어 체계에 집중하고 이에 적응하게 되면서 다양한 말소리를 구분하는 능력, 즉 음소지각능력이 점점 퇴화하는 것이죠.
브리티시 컬럼비아 대학교 Janet Werker 교수의 실험 결과, 6~8개월 영아들은 모국어 이외의 소리까지 세부적으로 구분할 수 있었지만 10~12개월 영아는 모국어 이외의 소리는 구분할 수 없었습니다.
인지 능력이 집약적으로 발달하는 영유아 시기에 모국어, 즉 하나의 언어만을 주로 접하게 되면서 수많은 외국어 말소리를 구분하는 능력은 빠르게 소실되는 것입니다.
앞선 [b]와 [p] 발음의 예시로 이 실험 결과를 쉽게 설명해보겠습니다. 발달 과정에서 하나의 언어에 집중적으로 노출된 영아는 [b], [p]만 구분하는 모국어 체계에 적응하면서 VOT 30ms를 경계로 소리를 구분하게 됩니다. 하지만 이러한 모국어 체계에 익숙해지기 전에는 더 세분화된 경계를 가지고 [b]와 [p] 말고도 더 많은 카테고리를 인식할 수 있는 것입니다. 결과적으로 태어난 직후의 아이들은 말소리를 세분화하여 구분하지만, 시간이 갈수록 모국어 체계에서 구분하는 발음만 인식할 수 있게 되는 것이죠.
영유아 시기에 다양한 언어의 소리에 노출되지 않으면 이 능력은 자연스레 소실됩니다. 만약 이러한 음소지각능력이 성인이 되어서도 유지된다면 어떤 일이 발생할까요? 다음 시간에는 음소지각능력이 언어 사용에 미치는 영향과 소실을 예방하는 방법에 대해 알아보겠습니다.
참고문헌
Janet F. Werker, Judit Gervain(2013), Speech Perception in Infancy: A Foundation for Language Acquisition