역사적 사실 왜곡을 위해선 언어 왜곡이 가장 우선시되었을 터다. 국어학이 쇠퇴한 까닭이다. 한국뿐만이 아니라 전 세계적으로 언어 왜곡이 심각하다. 인터넷 사전이 생긴 이후로 언어 왜곡이 너무나 쉽게 진행되었다. 이것을 토대로 인공지능이 더 큰 언어 왜곡을 생산할 것이다.
머지않아, 지구의 언어 왜곡이 극에 달하게 될 것이다. 전 세계 공통어인 파파와 마마도 황당한 어원으로 날조될지도 모르고 하나님(GOD)조차 다른 어원으로 날조될지도 모를 일이다.
기존 종이로 만들어진 언어 대백과 사전을 잘 간직해야만 할 것이다. 이미 도서관에서도 전 세계의 언어 대사전들이 사라진 지 오래일 것이다. 최근 것들은 종이 서적이라할지라도 이미 상당수 왜곡되었으리라고 본다. 특히, 한국의 경우, 일제강점기 때 조선어학회에서 펴낸 국어대사전이 유일할 듯싶다. 그렇지만 순수 의지의 조선어 사전 완성 이후에도 왜곡이 전혀 없었으리라는 보장이 있을지는 의문이다. 도서관에서 조회되는 사전들은 윈본이 아닌 1990년대 이후 출판본들이 거의 전부인 것 같다.
삼국시대나 고려시대나 조선시대에도 분명 우리말 사전이 분명 있었을 터인데ㅡ 왜, 이 나라에는 고유의 서적들이 남아있지 않은 걸까? 그나마 남아 전해지는 몇 안 되는 고서들마저 진본으로 여기지 않았다. 삼국사기와 고려사를 진본으로 인정하여 국보로 등록한 것조차 각각 2018년과 2021년도의 일이었다.
정말 너무들 하지 않은가? 왜 이렇게 우리 고유의 서적들을 소중하게 보존하고 관리하지 못했던 걸까?
이 나라의 지식인들은 그동안 다들 무엇을 한 것이란 말인가?결국 왜곡과 날조를 주관했거나 방조했다는 결론뿐이 아니겠는가? 이 나라의 기존 지식인들은 오히려 아무것도 하지 않는 것이 훨씬 나을 것이다. 그래야 더 이상의 왜곡이나 날조를 방지할 수 있을 테니까
자, 언어의 뿌리를 찾고 진짜 언어 대사전을 만드는 일이 아마도 진짜 이 나라를 홍익하고 홍익인간하는 지름길일 것이다. 우리말은 한자와 한글 둘 다 그 어원과 어의를 찾아서 진정한 우리말 대사전을 새롭게 펼쳐야만 할 것이다. 영영 혹은 영한 한영 대사전 등도 마찬가지로 새롭게 진짜 대사전을 만들어야만 할 것이다. 작금의 인터넷 사전의 왜곡되고 날조된 언어부터 다시 원복 시켜야만 할 것이다.
언어 사전에 모든 정보가 다 들어있기 마련이다. (백과 사전도 사전이지만 이미지 중심보다 텍스트 중심의 대사전이 바람직하다.) 온라인 위키 사전은 비전문가들이 만든 사전이며, 너무나 왜곡되고 거짓이 팽배하고 중간중간 내용상 오류가 넘쳐난다. 검증되지도 않은 사전을 사전이라고 할 수도 없다. 특히, 일부러 의도적으로 언어 왜곡을 일삼는다는 것이 너무나 심각한 현실이다.
AI가 제일 먼저 참조하는 것이 온라인 사전일 텐데ㅡ 이로 인해 오류가 오류를 계속 생산할 뿐이겠다.
그렇다면 지금부터 모든 언어 대사전을 제대로 편찬하는 게 가능할까? 물론, 불가능하지도 않지만 가능키도 매우 어렵겠다. 언어학 전문가들이 부재하기 때문이다. 새롭게 인재를 등용하고 관련 교육과 연구를 통하여 체계적인 방법론을 창조하여 진행할 수 있는 길은 분명 있다. 수십수백 명이 체계적으로 만들고 검증하여 최종 완성이 가능하고 이후지속적인 관리와 신조어 등록 및 현행화를 수행해야 할 것이다. 여기에도 많은 비용과 인력이 투입되어야만 가능한 일이겠다. 아마도 스타워즈 영화에 나오는 소형 우주선 한 대 정도 만들어내는 수준과 비슷한 비용이 투자되어야 가능하지 않을까 싶기도 하다.
인류가 지속적으로 지성적인 인류로 진화하고 정상적인 AI 인공지능의 시대를 열기 위해선 우주선보다 시급한 게 올바른 언어 대사전을 구축하는 일일게다. 인류의 문명과 모든 지식과 현재까지 알려진 진리와 진실이 곧 언어 대사전 안에 고스란히 다 담겨져 있을 테니까
진정한 AI는 진정한 언어 대사전을 기초 지식으로 활용하기 마련이다. 인간이 먹는 밥이 있듯이 AI가 주로 먹는 밥이 곧 언어 사전일 것이기 때문이다. 또한, 언어는 텍스트뿐만이 아니라, 음성(소리)과 이미지와 영상까지 모두 포함한다. 한마디로 AI가 활용하는 모든 데이터가 바로 언어인 셈이다.
인공지능 AI가 유일하게 만들어 내지 못하는 것들 중 한 가지가 곧 언어다. 언어에 대한 정의를 절대로 AI가 할 수 없다. 하나의 언어가 생겨서 언어화되기까지는 일련의 패턴과 초의식적인 무언가의 과정을 통해서 완성되기 때문이다. 누군가 신조어를 만들었어도 모든 인류가 공감하지 않는다면 그 신조어는 금세 사라진다. 언어는 일부러 만들어지는 것이 아니라 아주 자연스럽게 생성되어 공유되고 선택되어지고 최종 완성된다. 이렇게 신비로운 과정을 통해 최종 완성된 언어들에 대한 히스토리와 의미를 정의하는 것이 곧 언어 사전들이다. 이처럼 언어는 자체적으로 원천적인 에너지가 있다. 사람의 영혼처럼 언어 자체적으로도 무한하고 알 수 없는 영적인 무언가가 분명 존재하기 때문이다.
또한, 성경을 저술한 저자들처럼 언어 대사전을 만드는 사람들은 아마도 보통 사람들이 아닐 것이다. 아마도 하나님의 선택을 받은 사람들일 것이 분명하다. 모든 진실과 진리를 꿰뚫고 통찰해야 할 테니까