brunch
매거진 딴생각

AI가 한글을 만나면

by 딴생각
딴생각_100.jpg


얼마 전 스트레이키즈의 새 앨범 '두 잇(DO IT)'이 빌보드 메인 앨범 차트에서 1위를 했다는 소식을 접했습니다. 더 놀라운 점은 이번이 처음이 아니라 그동안 발매해 온 8장의 앨범이 모두 1위를 했다는 점입니다. '빌보드 200'에 처음 진입한 후 8장의 앨범이 연속으로 1위를 차지한 것은 빌보드 역사상 최초라고 합니다. 그 이름이 팝의 여왕 테일러 스위프트나 래퍼 지존 드레이크도 아니고 한국의 보이그룹 스트레이키즈라는 점이 놀라울 따름입니다.


strayKids 01.JPG 스트레이키즈

사실 이러한 K팝의 글로벌 현상은 일상다반사가 되었기에 그리 놀라운 일은 아닙니다. 이젠 K푸드, K뷰티, K드라마, K방산까지 다양한 분야에서 'K'의 위상은 세계를 무대로 확장되고 있으니까요. 그것 보다는 '한글(한국어)'이 주목받는다는 사실이 더 놀라운 현상같습니다. 한국 문화를 적극적으로 수용한 글로벌 소비자들은 처음엔 한국어를 영어로 번역하다가 다시 한국어를 주목하게 되고 결국엔 한글에 귀착하게 되는 현상을 목격하게 됩니다. 지금까지 87개국에 252개로 늘어난 세종학당이 수요를 감당하지 못해 계속 늘어나는 현상이 이를 방증합니다.


언어는 매우 무서운 현상을 일으킵니다. 프랑스 혁명이 프랑스어가 주목받는 계기를 만들었고, 영국과 미국의 산업혁명이 영어가 세계를 지배하게 만들었습니다. 국가 권력이 전 세계에 영향을 미치는 패권국이라면 주변 모든 나라의 언어에도 영향을 미치기 마련입니다. 그런데 요즘, 전혀 다른 현상으로 다른 언어가 주목을 받고 있습니다. 유튜브에서 음식을 먹는 영상을 보면 전 세계인들은 그것을 가리켜 'Mukbang (먹방)'이라고 부릅니다. 맞습니다. 그것은 한국어입니다. 또 다른 예를 들자면, 만두는 예전부터 전 세계인이 즐기는 음식이었고 영어로 '덤플링(dumpling)'이라고 불렀습니다. 그런데 한국의 비비고가 글로벌 시장을 장악해 버리니까 덤플링이 'mandu(만두)'로 불리기 시작했습니다. 문화 소비가 언어 소비로 변환되는 구조적 변화가 일어나고 있는 것입니다. 하지만 이 정도는 서막에 불과합니다. 진짜 무서운 변화는 아직 오지 않았습니다. 그것은 AI와 함께 등장할 것입니다. 과연, AI는 한글에 어떤 영향을 미치게 될까요?


mukban_miri.png


글로벌 AI 기본 사회의 등장

얼마 전 이재명 대통령은 전 세계 정상들이 모인 'G20 정상 회의'에서 '글로벌 AI 기본 사회'라는 새로운 개념을 제안했습니다. 다소 생소한 이 개념은 AI를 기술 경쟁의 수단으로만 보지 말고 전기, 수도, 인터넷처럼 공공재로 보자는 개념입니다. 즉, 전 세계 국민 모두가 기본적으로 누릴 수 있는 사회 인프라이자 권리로써 AI를 설계하자는 미래 비전을 담고 있습니다.


현재 AI 기술은 미국과 중국의 경쟁입니다. 그들이 바라보는 AI는 경제·안보·패권 경쟁의 무기입니다. 즉, 전 세계를 장악하기 위한 '전략적 자원'이자 독점해야 하는 기술인 셈입니다. 이 두 국가를 제외한 나머지 국가는 사실상 선택의 여지가 거의 없는 상황입니다. 미국이 개방형 AI 생태계를 갖고 있지만 오로지 미국 빅테크 기업이 기술을 독점하고 있으며, 그것을 선택하지 않는다면 중국판 거대 언어 모델인 '딥시크(DeepSeek)'처럼 중국이라는 공산국가가 통제하는 AI를 선택해야 합니다. 이런 상황에서 AI를 경쟁이 아닌 공공선의 관점으로 바라보는 것은 매우 신선한 시각입니다. 그것도 미국이나 중국처럼 패권국가가 아닌 한국이라는 국가에서 말입니다.


이상한 연결국가 - 대한민국

한국은 항상 두 강대국 사이에서 생존해온 국가입니다. 미·중 경쟁, 냉전 구조, 동북아 안보 질서, 경제 의존 구조까지, 미국과 중국 사이에서 어느 한 쪽 편을 들기엔 다른 한 쪽의 손실을 감당하기가 어려운 것이 현실입니다. 특히 지정학적 위치를 보자면 일본·북한·러시아까지 고려해야 하기 때문에 더욱 혼란스럽습니다. 이런 상황에서 한국이 할 수 있는 최선의 선택은 '연결국가(Connector Nation)'가 되는 것입니다. 둘 중 하나를 선택하는 것이 아니라, 양쪽의 대립을 완화하고 국제적 합의를 이끌 공간을 스스로 창출하는 전략입니다. 정보·문화·기술이 흐르는 중심축의 기능을 강조하는 것이 연결국가입니다.


이미 한국은 그런 움직임을 여러 차례 보였습니다. 기후변화에 대한 세계적 고민을 함께하기 위해 P4G 기후정상회의를 한국에서 개최했고, 코로나19 때 백신이 부족한 국가들을 지원하기 위해 글로벌 백신 허브를 만들었을 때도 그 역할을 한국이 도맡았으며, 개발도상국들에게 공적개발원조(ODA)의 일환으로 스스로 롤 모델이 되어 다양한 경험을 공유했던 것도 한국이었습니다. 이러한 연장선상에서 '글로벌 AI 기본 사회'를 전 세계에 제시한 것도 한국입니다.


미국과 중국이 아닌 AI 3대 강국?

한국은 세계에서 가장 빠른 속도로 사회 전체가 디지털화된 경험을 가진 국가입니다. 전 국민 스마트폰 사용률이 세계 1등이고, 공공서비스(세금·보건·행정)의 디지털 인프라가 완비된 국가이며, 자율주행·로봇·AI 등 거의 모든 첨단 분야가 골고루 발달된 국가입니다. AI 시대에 한국은 연결국가로서 데이터와 거버넌스를 조율하는 중심축이 될 수 있습니다.


최근 한국이 AI 인프라의 주요 거점으로 부상하면서 전 세계 AI 거물들이 한국으로 몰려드는 것도 그런 이유 때문입니다. 엔비디아의 젠슨 황이 굳이 한국에 와서 삼성·현대차와 치킨에 맥주인 '치맥 파티'를 한 것도, 아마존, 마이크로소프트, 구글, 오픈AI, 앤트로픽 등 수많은 AI 빅테크 기업들이 한국에 와서 데이터센터를 짓기 위해 부동산을 알아보는 이유도 미국과 중국이 아닌 제3의 대안을 한국이라고 전망했기 때문입니다.


사실상 AI 기술 역량만 놓고 보면 한국은 상위권이며, 반도체는 세계 최강입니다. 좀 더 객관적으로 말하자면, 글로벌 AI 리더십을 갖기 위한 기술 자격은 충분하지만 미국·중국처럼 패권을 노릴 만큼의 위치는 아닙니다. 이 점이 오히려 보편·공공성에 기반을 둔 'AI 기본 사회'에 적합한 국가 이미지를 만들어 주고 있습니다. AI를 인류 공동의 것으로 제안하는 데 걸림돌이 없으며, 국제사회가 받아들이기에도 부담이 없는 것이 한국이라는 국가가 가진 브랜드 이미지입니다.


이와 같은 이미지는 한국의 위상을 높여줍니다. 이미 한국은 정부 차원에서 'AI 3대 강국(AI G3)'을 목표로 하겠다고 선언하기도 했습니다. 여기서 핵심은 단순히 AI 기업을 많이 육성하는 수준이 아니라 한국이 AI 인프라, 반도체, 거버넌스, 데이터 규범까지 포함한 'AI 기본 사회'를 국가 차원에서 구현하고 이를 글로벌 표준으로 만들겠다는 야심찬 움직임입니다.


한글은 '문화 언어'를 넘어 'AI 친화 언어'

훈민정음AI.png


AI가 언어를 처리할 때, 단순히 텍스트를 읽는 것이 아니라 '토큰(Token)'이라는 단위로 분해해서 처리하게 됩니다. 토큰이 많을수록 처리 비용이 증가하고 AI 모델 학습에도 부담이 큽니다. 각 언어를 비교해 보면 다음과 같은 특징이 있습니다.

- 영어 : 발음-철자 규칙 불일치, 발음-철자에 예외가 많음, 토큰화 복잡

- 일본어 : 한자·히라가나·가타카나 혼합된 언어, 토큰화 복잡

- 중국어 : 글자는 단순하지만 글자 수가 너무 방대, 의미 단위 불명확, 토큰화 복잡

- 한글 : 생성 구조가 과학적, 조합 규칙이 일정하고 음운 구조가 간단해서 토큰화가 간단함


쉽게 말하자면, 한글은 분석하기가 쉽고 처리 비용이 적게 드는 'AI 친화 언어'라는 점입니다. AI 모델이 커지고 비용이 중요해질수록 문자 구조가 체계적이고 일관성이 뛰어난 언어가 AI 시대에 훨씬 유리해집니다. 세종대왕께서 이런 시대가 올 것을 대비해 한글을 창제한 것은 아니겠지만, 공교롭게도 인류가 키보드를 두드리기 시작하면서부터 한글은 키보드를 만드는 것도 유리해졌고, 스마트폰 시대에는 가장 빠르게 타이핑할 수 있는 문자가 되었으며, AI 시대가 도래하면서 AI 모델 비용이 가장 저렴하게 드는 문자 체계로 한글이 다시 주목을 받게 되었습니다.


실제로 챗GPT에 다음과 같은 흥미로운 질문을 던져봤습니다. “한글이 생성형 AI에 적합한 이유가 뭘까?”. 챗GPT의 답변에 따르면, 한글은 체계적이고 규칙적인 문자 구조, 풍부한 표현력과 명확한 문법, 그리고 맥락에 따라 유연하게 의미를 표현하는 특성을 갖추고 있어 거대언어모델(LLM)의 언어 이해와 생성 능력을 극대화하는 데 유리한 언어라고 합니다. 실제로 한글은 자음과 모음의 결합으로 음절을 형성하므로 실제 발음에 대응하는 음절 단위 분석이 용이해 AI 모델이 글자를 쉽게 인식할 수 있고, 철자와 발음의 차이가 큰 언어(특히 영어)나 수천 개 문자로 이루어진 언어(중국어·일본어)에 비해 적은 데이터로도 일관된 의미 학습이 가능하다는 점이 강조되고 있습니다.


이러한 한글의 장점 덕분에 구글은 AI 챗봇 ‘바드’의 첫 외국어로 한국어를 채택했고, 순다르 피차이 구글 CEO 역시 “한국어는 배우기는 어렵지만 프로그래밍에 가장 적합한 언어”라고 평가한 바 있습니다. ‘총, 균, 쇠’의 저자로 유명한 제레드 다이아몬드 역시 한글을 가리켜 “세계에서 가장 훌륭하고 과학적인 문자 체계”라고 인정했으며, 영국 서식스대 자연언어처리·언어학 교수인 제프리 샘슨도 한글을 “인류의 가장 위대한 지적 성취 중 하나”라고 평가했습니다.


앞으로 우리가 목격할 미래

지금까지 우리가 아는 언어의 확산 메커니즘은 다음과 같습니다. 식민지를 많이 가지고 있거나(스페인어, 포르투갈어), 산업혁명의 중심에 있거나(영어), 경제 패권을 장악했거나(중국어), 문화와 팬덤이 확산됐거나(한국어). 그런데 여기에 한 가지가 더 등장한 것입니다. 즉 AI 플랫폼 기반으로 확산에 유리하거나.


가령, 다음과 같은 일들을 상상해 봅시다.

- 만약 세계 여러 정부가 한국형 AI 행정 시스템을 도입한다면

- 만약 글로벌 기업들이 한국형 AI 데이터 플랫폼을 사용한다면

- 여러 나라의 공공서비스, 스마트시티, 의료, 학교가 한국형 AI 운영체제 기반으로 구성된다면


그러면 그 AI 시스템의 메뉴 구조, 문서 규격, 데이터 서술 방식, 디지털 리터러시, 머신러닝 학습 자료가 전부 한글 기반으로 설계될 가능성이 높아집니다. 마치 K팝이 유행하면서 팝송에 한글 가사가 자연스럽게 녹아든 것처럼, 어느 순간 한글은 기술 인프라의 백서처럼 자리 잡게 됩니다. K컬처가 한글을 '즐거운 언어'로 만들었다면, AI 플랫폼은 한글을 '필요한 언어'로 탈바꿈시킵니다. 이 확산은 K팝처럼 팬덤이 식어버리면 약해지는 단점이 없습니다. 왜냐하면 감정이 아니라 운영체계이기 때문입니다.


언어는 문화적 유행보다 기술 인프라로 자리 잡았을 때 훨씬 더 강력해집니다. 앞으로 미국과 중국이 아니라 새로운 연결국가가 대안으로 떠오를 것입니다. 그 국가는 AI를 경쟁으로 보는 것이 아니라 공공선으로 제시할 것이며, 국력의 하드파워가 아닌 문화의 소프트파워로 다른 국가들의 신뢰를 얻을 것입니다. 그리고 그 국가가 제시한 AI 거버넌스는 미국과 중국의 손아귀에 들어가지 않고 국제 표준으로 자리 잡을 것입니다. 그리고 그 안에서 새로운 문자 체계가 조용하고 강력하게 등장할 것입니다. 만약 그 연결국가가 한국이 된다면, 그 문자 체계는 한글이 될 것입니다.


K culture 001.jpg


keyword