brunch

You can make anything
by writing

C.S.Lewis

by 콜랑 Dec 06. 2023

언어 처리 A.I.

- A.I. 연구에 대한 단상

어제 작성한 글('꾸다+이→꾸이다' - 시대별 직관 차이 (brunch.co.kr))에서 '@사오 김'님의 댓글에 답글을 달면서 한국어 연구자들이 얼마나 심각한 노가다(?)를 해야하는지에 대해서 새삼 깨달았다. 댓글과 답글의 내용에는 '피사동 접사의 용법이 왜 딱부러지지 않는가'에 대한 고민이 포함되어 있다.


2023년 현재 한국어 화자의 직관으로 '빌리다'를 '빌다'의 피동사라고 생각하는 사람은 거의 없을 것이다. 그런데 형태론적으로는 '빌- + -리-'로 분석되는데 이 때 '-리-'는 사동 표지는 아니므로 피동 표지일 가능성이 크다. 논리적으로 생각해 보면 '빌리다'의 의미는 빌리는 주체의 관점에서 보면 '빌려지다'를 뜻하니 '빌리다'는 '빌다'의 피동으로 분석될 수 있다. 직관은 아닌데 논리는 그럴 수 있다. '꾸다'와 '꾸이다'의 관계가 그런 예에 해당한다. 다만, '빌리다'는 현재에도 많이 사용되지만 '꾸이다'는 거의 사용하지 않는다. (그러고 보니 '빌리다'와 '꾸이다'가 경쟁하다가 '꾸이다'가 밀려났을 가능성이 있겠구만!) 여기에 '-어 주다-'가 통합하는 '빌려주다', '꾸어주다'에서는 태 해석이 또 달라진다. '안다, 안기다, 안겨주다', '보다, 보이다, 보여주다', '듣다, 들리다, 들려주다' 등을 보면 한국어에서 접사에 의한 태 표시 방법이 체계적이지 않음을 알 수 있다.


한국어 연구자들이 왜 그런지를 연구하려면 기본적으로 통시적인 자료 분석을 수행해야 한다. 과거 자료를 모으는 일이야 역사 말뭉치를 포함한 다양한 말뭉치가 구축되어 있으니 큰 문제가 아닐 거다. 문제는 필요한  'X-이/히/리/기'형 용례를 추출해 놓고서는 모든 자료를 일일이 검토하면서 피동인지 사동인지를 판단하는 작업을 해야 한다는 거다. 이건 완전히 쌩노가다다. 이런 연구를 수행하는 모든 언어학자들에게 박수를 보내고 싶다. 나는 죽지 않아도 된다면 하기 싫을 것, 아니 하기 싫다.


이렇게 무언가를 '하기 싫다'는 생각이 들 때, 누군가가 대신해 주면 박수를 보내고 싶어진다. 시대가 시대인 만큼 이럴 때 먼저 생각할 수 있는 게 A.I.다.


인공지능 연구자들은 번역이건 문서 작성이건 언어처리 완성 단계에 해당하는 자료를 바탕으로 인공지능을 개발한다. 두뇌가 작동하는 방식을 어느 정도 이해한다면 이런 식으로 인간의 언어 처리를 흉내내는 데에는 한계가 있을 것이 뻔해 보일 텐데 왜 피동 인공지능, 사동 인공지능, 문장 성분 인공지능, 품사 인공지능 등등을 몽땅 따로 개발하는 시도를 하지 않는지 모르겠다. 사실 품사 인공지능은 한국어 형태소 분석기가 개발되어 있어서 상당한 수준의 개발이 완료된 상태라고 할 수 있을지도 모른다(아쉬운 점에 대해서는 다음 기회에...) 언어 처리를 위해서 고려해야 할 여러 분석기를 개발할 때 A.I.를 이용하고, 이를 조합하는 A.I.를 개발하면 어떨까 싶다.


사실 현 시점에서 내가 가장 해 보고 싶은 일인데, 문송할 따름이다. ^^;;


같은 목표로 함께 할 수 있는 인프라(팀)가 있으면 울매나 조을꼬... ㅠㅠ




<대문 이미지 출처: 엑소브레인사업단(Exobrain)>

작가의 이전글 '꾸다+이→꾸이다' - 시대별 직관 차이
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari