국어에 대한 궁금증을 스스로 풀 수 있는 몇 가지 방법

by 김선철


국어에 대해 관심이 많은 분들을 만나 보면 대개 학창 시절 선생님의 영향으로 그렇다는 얘기를 많이 듣게 된다. 필자가 기억에 남는 어떤 분의 그러한 계기는 중학교 때 ‘자음접변’이라는 용어를 접했던 일이었다. 나이 지긋하신 분들은 이 용어를 기억하실 수 있을 것인데, 회상을 돕자면 꽤 오래전 학계와 교육계에서 ‘자음동화’로 대체된 이 용어는 자음들이 만나면 어느 하나 또는 경우에 따라 둘 다가 서로 닮게 변하는 현상을 일컫는다. 이에 대한 국어 선생님의 강의 내용을 접한 그분은 강한 끌림을 느껴 이때부터 말소리의 세계, 단어의 세계에 푹 빠져들었고 결국 국어학을 전공하기에 이르렀다고 한다. 필자 주변의 몇몇 국어학 전공자들도 이와 비슷한 경로로 국어학을 업으로 삼고 있다.


이 글에서는 국어학자 못지않게 우리말의 이모저모에 대해 관심이 깊으신 분들이 낱말의 유래에 대한 궁금증을 스스로 해결할 수 있는 방법 몇 가지를 소개하고자 한다. 이것들은 학계에서 사용하고 있는 기본적인 수단으로서, 국어 전공자가 아니더라도 충분히 이용할 수 있는 것들이라고 여겨진다.


먼저 어원이나 유래를 찾아보는 방법을 시작으로, 같은 부류의 낱말들을 찾는 방법(형태편, 의미편), 마지막으로 외래어의 첫 쓰임과 변천 과정을 찾는 방법 순으로 적고자 한다.


(1) 어원이나 유래를 찾아보는 방법

우리는 꽤 자주 어원을 궁금해한다. 그 이유는 인간에게 본인의 정체성과 뿌리를 확인하고자 하는 욕구가 기본적으로 깔려 있어서가 아닐까 짐작해본다.


어원을 확인하는 가장 확실하고도 쉬운 방법은 당연히 어원이 풍부하게 실린 사전을 찾아보는 것이다. 필자가 ‘사심 없이’ 추천하는 그런 사전은 국립국어원의 ‘우리말샘’(https://opendict.korean.go.kr/main)이다. ‘어원 사전’이라는 제목을 달고 나와 있는 종이 사전들도 있으나 대개 양이 적고 국어학자가 아닌 저자가 지은 책의 경우는 믿기 어려운 정보들도 있어서 그리 추천하지 않는다. 하지만 온라인 사전인 ‘우리말샘’은 국가에서 편찬하고 운영하기 때문에 학계에서 두루 인정되는 연구 성과를 정리해서 올리고 있다.


예를 하나 들어보자. 예쁘지 않은 손글씨체를 언젠가부터 ‘개발새발’이라고 묘사한다. 원래는 ‘괴발개발’이었는데, 여기서 ‘괴’가 무엇일까? 사전을 찾아보면 아래와 같이 나온다. 즉, ‘괴’는 고양이의 옛말이었음을 알 수 있다. 이렇게 《우리말샘》에서는 고유어와 한자어의 경우 ‘역사 정보’란에, 외래어의 경우 ‘어원’란에 어원(대부분의 고유어의 경우 정확하게는 역사적 변화가)이 설명되어 있다.


25_win_image01.png


불편한 진실 하나를 밝히고 넘어가야겠다. 우리말 살려 쓰기를 주제로 삼는 여러 책자에서 굉장히 많이 등장하는 ‘윤슬’을 《우리말샘》에서 검색하면 아래와 같이 나온다.


25_win_image02.png


한자어나 외국어냐를 알려주는 원어 정보와 유래를 알려주는 역사 정보나 어원 쪽이 비어 있는 것을 보니 이 말은 고유어이고 밝혀진 어원은 없다. 실은 고유어의 태반은 어원이 불분명하다. 왜냐하면 너무 오래된 말이어서 탄생에 대한 기록이 없기 때문이다. 더구나 우리 민족의 역사는 몇 만 년일지도 모르는데 한글은 태어난 지 이제 겨우 580년 남짓이다. 한글이 훨씬 일찍 탄생했더라면, 혹은 우리 조상이 외래 문자라도 한자가 아닌 음소문자를 사용했더라면 고유어의 어원이 더 많이 밝혀져 있을 터이니 안타까운 마음이 든다.


그런데 ‘윤슬’에 딸린 ‘관련 어휘’란에 윤슬과 마찬가지로 역시 요즘 거의 쓰이지 않는 ‘물비늘’이라는 말이 참고 어휘로 올라 있음을 볼 수 있다. 이렇게 국어사전에는 갖가지 정보들이 숨어 있어서 볼수록 새롭고 배울 것이 많아 좋다는 분들이 있다.


사전에 어원이 원래의 개념에 가깝게 드러나 있는 것은 대개 외래어의 경우이다. 예를 들어, 우리가 얼핏 생각할 때 고유어라고 여길 수 있는 ‘붓’은 실은 중국어에서 차용한 외래어이다. 이는 너무 오래 전에 들어와 이른바 귀화어로 분류될 수 있는 것이어서 그 내용은 아래처럼 ‘역사 정보’란에 정리되어 있다.


25_win_image04.png


그러나 모든 귀화어의 어원이 ‘역사 정보’란에 풀이되어 있지는 않으며 아래처럼 비교적 근래에 유입된 것은 ‘어원’란에 풀이되어 있다.


25_win_image05.png


(2) 같은 부류의 단어들을 찾는 방법(형태)


“리 리 리 자로 끝나는 말은”이라는 동요가 있다. 국어사전에 몇 개나 올라 있는지 찾아보려면? 합리적인 방법은 두 가지이다. 첫째, 역순 사전을 찾는 방법이다. 찾아보니 지금은 절판 상태라 새 책 대신 중고 서점에서나 구할 수 있지만 시중에 나와 있는 역순 사전이 하나 있다. 이것은 표제항을 가나다 순의 반대로 배열한 것으로, 만약 실제로 존재한다면 맨 처음 등장하는 말이 ‘ㅎ’ 받침에 모음자는 ‘이’이고 초성자도 ‘ㅎ’인 말이 수록되어 있어야 한다. 그러나 그런 말은 아직 없어서 다른 것이 나온다. 그 역순 사전은 방언과 한자, 외래어를 수록하지 않았기 때문이다(《우리말샘》의 수록 어휘가 온전히 들어 있다면 ‘힠’이라는 ‘흙’의 경남 방언이 역순 정렬에서 맨 처음 나오게 될 것이다). 이 역순사전에서 ‘리’ 항을 보면 ‘리’로 끝나는 말이 한 곳에 모두 모여 있다.


다른 하나는 《우리말샘》의 ‘자세히 찾기’ > ‘단어로 찾기’ 기능을 이용하는 것이다(더욱 세밀하게는 ‘자소로 찾기’ 기능을 이용할 수 있다). 여기서 유의해야 할 점 한 가지는 우리가 찾고자 하는 것이 2음절 이상의 단어이기 때문에 음절 수 범위에 이를 표시해야 한다는 것이다. 그렇지 않으면 단음절어 ‘리’까지 검색되어 나오게 된다.


다음 그림처럼 단어, 일반어, 고유어, 혼종어(고유어+한자어, 고유어+외래어, 한자어+외래어 등)로 한정하고 음절 수를 편의상 2~9까지 지정하며, 찾을 대상에서 끝 문자를 ‘리’로 하여 ‘찾기’를 누르면 결과가 바로 나온다(《우리말샘》에 올라 있는 표제항 중 가장 긴 것은 이 글을 쓰는 현재 66자이므로 남김없이 추출하려면 음절 수 지정의 상한을 66 이상으로 해야 하며, 범위를 좁히지 않고 그렇게 추출하면 3만 3천 개가 넘게 나온다).


25_win_image06.png


위와 같이 설정하여 검색한 결과는 총 4753개로 첫 부분이 아래와 같다.


25_win_image07.png


4753개는 간단하게 훑어 보기에도 너무 많아서 일반적인 우리의 관심에 맞게 혼종어와 전문어를 제외하니 2213개가 나왔다.


25_win_image08.png


앞서 얘기한 동요의 전체 가사는 “리 리 리 자로 끝나는 말은 괴나리 보따리 댑사리 소쿠리 유리 항아리/리 리 리 자로 끝나는 말은 꾀꼬리 목소리 개나리 울타리 오리 한 마리”이다. 이제 기억 나셨는지?


(3) 같은 부류의 단어들을 찾는 방법(의미)


우리말은 많은 경우에 형태가 비슷하면 의미도 비슷한데, 반드시 그런 것은 아님은 독자들께서도 잘 알 것이다. 그렇다면 의미가 비슷한 것들을 찾는 방법은 뭘까. 역시 국어사전을 이용하는 방법이 가장 낫다. 사전에는 뜻풀이라는 항목이 있기 때문에 우리가 이를 해낼 수 있다. 게다가 비슷한 것들은 최대한 같은 틀로 풀이를 적게 되어 있어, 그 틀만 찾아내면 우리가 하고자 하는 바를 쉽게 이룰 수 있다.


‘잠’을 예로 들어보자. 우리가 흔히 말하는 잠으로는 꿀잠, 늦잠, 단잠, 새우잠, 선잠, 쪽잠과 같은 것들이 있다. 이 가운데서 ‘꿀잠’을 찾아보면 ‘아주 달게 자는 잠’, ‘쪽잠’은 ‘짧은 틈을 타서 불편하게 자는 잠’이라고 풀이되어 있어 잠의 종류들은 ‘자는 잠’이라는 풀이가 그 틀임을 알 수 있다. 그래서 《우리말샘》에서 ‘자는 잠’이라고 검색하고서 ‘뜻풀이’ 탭을 보면 모두 73개의 어휘가 검색되어 나온다.


25_win_image09.png


그런데 여기에는 뜻풀이 항에 ‘자는 잠’이라는 문구가 포함된 것이 모두 들어 있어 유의해야 한다. 예를 들어, ‘환자는 잠재적으로’라는 문구에 ‘자는 잠’이 포함되어 있어 ‘풍진 적혈구 응집 억제 검사’라는 전문어가 결과에 포함되어 있다. 이런 것들만 걸러내면 우리말에 들어 있는 잠의 종류가 다 나오게 된다.


이러한 73개 결과를 훑어보면 ‘꽃잠’(결혼한 신랑 신부가 처음으로 함께 자는 잠), ‘나비잠’(갓난아이가 두 팔을 머리 위로 벌리고 자는 잠)과 같은 재미있고 귀여운 표현들을 만날 수 있다. 종이사전에서는 기대하지 못했던 이런 다양한 기능들이 전자사전에서 손쉽게 이루어진다.


(4) 외래어의 첫 쓰임과 변천 과정을 찾는 방법


우리나라 땅이 대륙에 바로 이어져 있고 조상들이 주변의 이민족들과 수 천 년 이상 상호교류하면서 살아온 때문에 우리말에는 수많은 외래어들이 있다. ‘송골매’처럼 몽골어에서 온 것, 앞에서 본 ‘붓’처럼 중국어에서 온 것, ‘아수라장’처럼 불교를 통해 들어온 인도의 산스크리트어에서 온 것, ‘가방’처럼 일본어에서 온 것, ‘남포’처럼 구한말 이래 영어에서부터 온 것 등 아주 다양하다. 이러한 것들 가운데 조선 시대 이전에 들어온 말들은 국어사전의 어원란이나 역사 정보란에 잘 정리되어 있다. 그러나 개화기 이래 들어온 영어나 일본어, 네덜란드어, 포르투갈어 등은 아직 그만큼 잘 갈무리되어 있지 못한 것이 사실이다. 이런 외래어의 유래에 대해서는 아직은 약간의 노력으로 개인이 잘 찾을 수 있기 때문에 그리 문제가 되지는 않겠지만, 변화가 축적되면 고유어나 한자어와 동등하게 역사 정보가 기술되어야 할 것이다.


필자가 외래어의 유래를 확인한 예를 들어본다. ‘트로트’는 영어이지만 서양에 없는 음악 장르여서 일종의 콩글리시 혹은 일본식 영어인 징글리시 가운데 하나일 것으로 추정할 수 있다. 대중음악사 연구서에 따르면 1950년대까지 대중가요의 주종을 이뤘던 트로트는 당시에 그냥 ‘유행가’로 불렸다고 한다. 그러다가 서양 음악이 본격적으로 수입되면서 장르 구분이 이루어지고, 그때서야 누군가가 ‘트로트’라는 표현을 만들었다. 일본에서는 이를 ‘도롯도’라고 하는데, 이것은 우리나라에서 불리는 한국화된 엔카를 일컫는 것일 뿐이다. 즉, ‘도롯도’는 ‘트로트’를 수입하여 그들 식으로 변형한 일본어의 외래어인 것이다(본인들의 엔카는 여전히 ‘엔카’로 불러 오고 있다). 결국 ‘트로트’란 말을 붙인 이는 우리나라 사람이고, 이 말은 영어에서 바로 수입한 것이라고 보아야 하는 것 아닌가 한다. 그래서 국어사전들에서 ‘트로트’의 어원은 영어 ‘trot’로 되어 있다. 이의 정황을 확인할 수 있는 것은 옛 문헌이나 신문 아카이브이다. 필자가 직접 찾아본 바에 따르면 ‘트로트’가 언론 기사에서 쓰인 첫 사례는 광복 이전인 1935년 8월 25일자 동아일보 기사였다. 일본어의 영향이 지대했던 당시에 ‘도롯도’가 아닌 ‘트로트’가 쓰였다는 사실은 이 말이 영어에서 직수입된 용어로 생각할 수 있는 근거 가운데 하나라고 생각된다.


이러한 외래어의 출현과 변천을 추적할 수 있는 아카이브 몇 가지를 소개해 본다. 먼저, 가장 추천하는 것은 네이버 뉴스라이브러리(https://newslibrary.naver.com/search/searchByDate.naver)이다. 여기에는 국내 최대 포털 기업의 서비스답게 가장 방대하고 오래된 신문 자료들이 들어 있다. 원문을 이미지로 볼 수 있으며, 이미지가 흐릿한 경우를 보완하기 위하여 입력문도 갖추고 있다.


그다음은 대한민국 신문아카이브(https://www.nl.go.kr/newspaper/)이다. 네이버 뉴스라이브러리에서 검색되지 않는 것이 여기서 검색 결과로 나오는 경우가 가끔 있어 보완이 된다. 필자의 경우 ‘바지선’의 첫 쓰임을 네이버 뉴스라이브러리가 아닌 이곳에서 검색할 수 있었다.


신문이 아닌 일반 문헌은 한국학자료통합플랫폼(https://kdp.aks.ac.kr/)을 이용하면 된다. 다만, 이곳은 구한말까지의 한문 및 한글 문헌을 주로 갖추고 있기 때문에 근대 외래어는 다른 곳보다 정보가 덜 나오므로 옛 한자어의 검색에 쓸모가 크다. 한 가지 크게 실망스럽고 유의해야 할 점은 통합검색 결과가 미덥지 못하다는 사실이다. 개별 데이터베이스를 선택한 결과에서는 나오는 것이 통합검색에서는 나오지 않을 때가 있기 때문이다. 따라서 여러 번, 여러 군데에서 검색해야 사실에 가까운 결과를 얻을 수 있다. 이는 시스템의 불안정이나 검색 엔진의 미비 때문일 텐데, 이공계에 투자하는 자금만큼은 아니더라도 구축한 데이터를 원활히 검색할 수는 있도록 정부가 지원해 주었으면 한다.


한 예를 들자면, 훈민정음 해례본 어제서문에 ‘중국’이라는 표현이 있는데 한때 이것이 지금의 중국을 가리키는 것이 아니라는 주장이 대두된 적이 있었다. 그러나 이 플랫폼에서 검색해보면 일찍이 1145년에 편찬된 삼국사기에도, 그리고 그보다 훨씬 앞선 통일신라시대의 김인문 비문에도 ‘중국’이 등장함을 찾아볼 수 있다. 그러나 이러한 결과는 아래처럼 통합검색으로는 나오지 않고


25_win_image11.png


아래와 같이 개별 데이터베이스를 지정하여 따로 검색해야 나온다.


25_win_image12.png


단어뿐 아니다. 한 가지 흥미로운 예를 보자. 명량해전에서 이순신 장군이 적선 133척을 무찌를 때 동원된 배는 단 10여 척이었다고 한다. 그런데, 그것이 12척인지 13척인지 국사학자들 사이에 의견이 분분한 적이 있었다. 이순신이 선조에게 올린 장계에 今臣戰船 尙有十二라고 했다는 것이 《난중일기》에 나온다는 시중의 얘기는 낭설이었을까?


여기 《한국학자료통합플랫폼》에서 이 8자를 찾아보면 이런 설은 절반만 맞다는 점을 확인할 수 있다. 우선 통합검색을 해보면 출전이 되는 문헌이 《난중일기》가 아닌 문헌 3개가 나오고, 여기에서 우리는 12라는 숫자를 확인할 수 있다. 검색 결과로 나온 것 가운데 맨 마지막 자료는 《이충무공전서》에 포함된 《선묘중흥지(宣廟中興誌)》로서 저자가 이순신 본인이다.


25_win_image13.png


개별 데이터베이스에서 더 검색해 보면 《난중일기》에는 나오지 않고, 《선묘중흥지(宣廟中興誌)》를 비롯한 《이충무공 행록(李忠武公 行錄)》, 《이충무공 행장(李忠武公 行狀)》, 《시장(諡狀)》, 《신도비(神道碑)》 등에 이 8자로 된 문구가 등장한다. 결국 우리는 12척이 있었다는 점이 장계를 올릴 당시의 이순신이 처했던 역사적 사실이며, 이 상소가 《난중일기》가 아닌 다른 문헌에 실렸다는 점을 알 수 있다.


지금까지 인터넷만 된다면 마음껏 즐길 수 있는 우리말 산책 방법을 소개해 보았다. 이런 호사는 자료 입력자들, 연구자들, 검색기 개발자들 등 수많은 사람들의 뼈를 깎는 노력 덕분에 우리가 누리는 것이다. 그분들의 노고에 깊이 감사드린다.


그런데, 딥러닝 기술 덕분에 몇 해 전부터 갑자기 번역기의 성능이 급격히 좋아졌다. 이제 웬만한 언어는 번역기를 이용하여 우리말로 그리고 그 반대로도 번역되고, 그게 마음에 들지 않으면 영어를 거쳐 번역시켜 좀 더 나은 결과를 얻기도 한다. 필자 또한 그 덕분에 외래어의 원어를 찾아보기도 하고, 외국의 뉴스도 쉽게 접하고 있다.


그러한 번역 기술을 활용하여 외래어의 원어를 추적해 본 한 가지 예를 들어본다. 바지 밑단을 한번 접어 올려 멋을 낸 것을 일본에서 온 외래어로 ‘가부라’라고 한다(우리말로는 ‘접단’ 등으로 다듬어진 바 있다). 흔히는 ‘카브라’, ‘캬부라’ 등으로 변형되어 쓰이는데, 이러저러한 일본어 표기를 검색창에 넣으면서 일본어 사전을 뒤져보면 해당되는 요즘의 표현은 ‘다부루’(double)란다. 그래서 ‘다부루의 옛말은 무엇인가요’ 등을 일본어로 번역시킨 다음 일본의 포털사이트에서 검색하며 정보를 찾아보았다. 그 결과 이것이 영어로 ‘턴업’(turnup)인데, 어떤 일본인이 영미인으로부터 ‘터닙’(turnip, 순무)이라고 한다는 것으로 잘못 알아듣고 당시 일본의 순무에 해당되는 표현인 ‘가부라’로 퍼트렸다는 설을 소개하는 몇몇 사이트를 찾을 수 있었다. 또한, 그런 내용이 담긴 유튜브 동영상도 하나가 있었다.


일본어 자료를 찾은 경험을 언급했지만 다른 언어에서도 이와 비슷하게 번역기를 십분 이용하면 우리가 원하는 자료를 외국어 자료에서 찾아내는 데 도움이 될 수 있을 것이다.


요즘은 거의 매일 인공지능이 뉴스의 한 켠을 장식하는데, 인공지능의 혜택으로 말미암아 언어학 및 국어학의 도약적인 발전을 기대해 본다. <끝>



** 이 글은 <<말과글>> 2025년 겨울호에 실린 것을 수정한 것입니다.

작가의 이전글어휘 의미의 분화: ‘끊다’와 ‘파다’