brunch

"생산량이 연평균 2.1%밖에 늘어나는 데 그쳤습"

- 병렬적 통사 처리의 디테일

by 콜랑

인간은 문장을 생성할 때 어떤 과정을 거칠까? 뉴런을 뜯어보고 시냅스 지도를 그려볼 수만 있다면 좋으련만... 그래도 아래 영상은 흥미로운 점을 생각해 보게 하는 자료인 것 같다.



재생 22초 구간을 보면 "생산량이 연평균 2.1%밖에 늘어나는 데 그쳤습니다."라는 발화를 들을 수 있다. 친철하게 자막까지 달려있다. 분명히 머리 속에는 두 가지 표현이 떠올랐던 게 틀림 없다.


1) 생산량이 연평균 2.1% 늘어나는 데 그쳤습니다.

2) 생산량이 연평균 2.1%밖에 늘(어나)지 않았습니다.


화자의 LLM은 확률값이 꽤나 높은 1)과 2)를 동시에 발화 후보 문장으로 출력한 모양이다. 다만, 통사 처리 과정에서 최종 선택된 출력 형태는 1)임에도 불구하고 [AT MOST] 관념이(한국어로는 '~밖에 + Neg' 구성에 해당한다) 간섭을 일으켜 '밖에'가 끼어든 모양새다. (이론 언어학에서는 이런 과정을 상정하지도 않고 상상하지도 않는다. 생성이든 분석이든 이런 현상에 대해서는 접근하려고 시도하지도 않는다. 그러나 '인간의 언어'가 아닌 '인간이 학습한 언어'를 연구한다.) 이와 같은 현상은 오히려 GPT같은 LLM의 관점에서 접근하면 훨씬 자연스러울 수 있다. 문장 생성 과정에서 계산된 1)의 확률값과 2)의 확률값이 엇비슷했기 때문이라고 설명하 가능성이 열린다. (물론 "근거가 있이"에서 설명한 현상처럼 인간과 AI의 차이가 분명함에도 불구하고) 적어도 이론적으로는 그렇지 않을까? 신경과학과 인공지능의 접면 그 어드메에서, 언어 연구의 지평은 인간의 두뇌 기능으로까지 확장되고 있는지도...


인간의 두뇌는 병렬 처리 능력이 있다. 운전하면서 이야기하는 것처럼. 보다 구체적으로는 인간의 언어 능력도 하부 기능들의 병렬 처리에 의해 가능하다고 여겨진다. 위 영상의 사례를 보면 여기서 좀더 구체적으로 들여다 볼 필요가 생긴 것 같다. 언어 능력의 하부 기능인 통사 처리도 하나의 관념에 대응하는 복수의 표현을 병렬적으로 입력받아서 처리하는 게 분명해 보인다.


keyword
매거진의 이전글"목숨을 달리했죠"