영어만이 아니다. 그 자리에 다른 외국어나 아니면 모국어를 넣는다 해도 달라지는 것은 없다. 언어를 익힌다는 것은 바로 패턴인식 Pattern Recogniton 과정이다.
'패턴인식'은 인지과학이나 인공지능에 속하는 연구 분야다. 컴퓨터는 자연언어의 구문 패턴을 이해하기 위해 지금도 쉬지 않고 학습하고 있다. 낮에 배운 지식을 장기 기억으로 전환시키기 위해 반드시 필요하다는 휴식기, 사람이 잠을 자는 그 시간에도 컴퓨터는 쉬지 않고 학습한다. 신경망 네트워크에서 하나의 노드 node를 통과한 자료가 다른 노드의 입력값으로 전환되기 전에 머무는 그 짧은 시간. 컴퓨터에게 잠이란 그런 의미인지도 모르겠다.
우리는 모국어를 듣는 순간 이해하며, 읽으면 바로 그 의미를 파악한다. 그러나 외국어는 그 이해하는 순간과 의미를 파악하는 순간이 대단히 길다. 그 시간이 모국어를 인식하는 시간에 수렴할 때 우리는 이중 언어권자가 되며, 발산할 때 우리는 통역이나 번역이 필요하게 된다. 모든 갈등은, 그 지지고 볶는 '학습'이라는 함수의 기울기 변화가 만들어낸다. 시간과 비용은기울기를 바꾸는 변수다. 함수의 모양이 어떤 것이 되더라도 결국에는 한 곳으로 모인다. 그리고 그 곳을 '패턴인식 절차'라고 부른다.
haʊr gɛtɪŋ əˈlɔŋ ðiːz deɪz
이 소리는 무슨 뜻일까? 영어를 모국어로 쓰는 사람은 순간적으로 "요즘 어떻게 지내십니까?"로 인식할 수 있다. 일본어 화자라면 아래와 같은 소리를 듣고 나서 "아, 이건 파는 물건이 아니에요."라고 즉시 반응할 수 있다.
koɾe ha i↧kɯᵝɾa desɯᵝ ka
아래와 같은 소리를 듣고 "종이에 적어드릴까요?"라고 대답하려면 어떤 언어를 배워야 할까?
aβle maz ðesˈpaθjo poɾ faˈβoɾ
말을 배운다는 것은 패턴인식 시스템을 장착하는 일과 같다. 청각 기관으로 들어오는 소리(말)와 시각 기관으로 들어오는 이미지(글)를 뉴런 neuron에 입력하여 그 정보를 가지고 새로운 자극을 인식하는 과정이다. 어릴 때는 이 시스템을 만드는 일이 쉽다. 그러나 어른이 된 다음에는 거의 불가능할 정도로 어려운 작업이라 수십 년 또는 평생을 걸쳐 학습해야 하는 것이다. 우리는 지금 이런 언어 학습마저 사람보다 기계가 더 잘하는 시대에 살고 있다. 수년 안에 기계가 거의 모든 자연언어를 학습하여 통역과 번역 시장을 뒤집어엎을지도 모른다는 불안은 추측이 아닌 통계적 사실로 증명된다.
dejəs ɛks mɑkɪnə
질 quality을 바꾸는 것은 양 quantity이다. 반복을 통해 자연스럽게 패턴을 알게 되는 학습과정은 기계학습 Machine Learining 방법론과 닮았다. 아니, 사실은 기계학습이 사람을 흉내 낸 것이다. 기계가 사람을 흉내 내어 만든 더 월등한 능력을 인간이 다시 모방하는 시대, 기계가 거꾸로 인간에게 교훈을 주는 시대에 외국어, 새로운 말을 배운다는 것은 어떤 의미가 있을까?