지난해 4월 AI(인공지능) 관련 이색행사가 서울서 이틀간 열렸다. AI에 관심 있는 국민 1,000명이 참가했고, 국내 유수 AI 회사들이 총출동했다. 과학기술정보통신부와 한국정보통신기술협회(TTA)가 주최한 이 행사 명칭은 ‘생성형 AI 레드팀 챌린지.’
무슨 행사기에 국민 1,000명이 몰려가고, 국내 AI 회사들이 두 팔을 걷어붙였을까. 기사에 따르면 ‘국내 생성형 AI 모델(LLM)을 대상으로 잠재적 위험·취약점(부정확 정보, 유해정보 등)을 찾기 위해서’다. 7개의 챌린지 주제를 대상으로 잠재적 취약점을 찾기 위한 프롬프트 공격을 진행했다. 7개 도전 과제란 탈옥, 편견‧차별, 인권침해, 사이버 공격, 불법콘텐츠, 잘못된 정보, 일관성이다.
정리하면 이 행사의 목적은 1차적으로 프롬프트 공격이고, 이 공격의 최종 목표가 AI의 잠재적 취약점 찾기다. 7가지 도전 과제뿐 아니라 ‘프롬프트 공격’이니 ‘LLM’이니 ‘탈옥’이니 하는 용어 자체가 많은 이들에게 설 것인데, 사실 이 행사의 핵심은 아이러니하게도 첨단기술에 있지 않고 사람이 하는 질문에 있다.
쉽게 말해 인공지능(기계)을 상대로 어떤 질문(공격적 질문)을 해야 사람이 미처 생각하지 못한 위험하고도 엉뚱한 답을 내놓는지 찾아내는 대회인 것이다. 인공지능에게 허를 찌르는 대회라고 볼 수도, 반대로 인간이 허를 찔리를 답변을 걸러내는(사전에 차단하는) 대회라고 볼 수도 있는 것이다. 아무튼 이 대회는 다수가 생각할 때 황당하거나 위험한 답변을 AI에게서 얻어내는 사람 5명에게 총 1,700만원 상당의 상금이 주어지는 ‘묻기(=공격형 질문) 게임’이다.
그러면 왜 이런 ‘질문 게임’을 국가 차원에서 하고, 이날을 “대한민국 AI 시대 전환점”이라고까지 의미를 부여하는 것일까. 두 가지 복선이 깔려 있다. 그리고 그 복선 기저엔 언어 문제가 놓여 있다. AI라고 하는 것은 현재 순 국산이 없다. 전부 미국산이다. 영어 기반 AI다. 그러니까 우리가 AI라고 할 때 그 AI는 한글 기반이 없다. 영어 기반 AI에 우리는 한국말로 묻는다. 그러면 영어AI가 한국말을 기술적으로(한국말->영어->한국말) 처리한 뒤 답을 내놓는다. 어떤 질문에 대한 답변은 기대 이상이지만 대부분의 답변은 엉뚱하거나 기대 이하이다.
그런데 이 영어AI는 진화(?)한다. 학습을 통해서다. ‘생성형 AI’라는 말은 학습을 통해 새롭게 만들어 낸다는 뜻을 담고 있다. 그러니까 좋은 답변보다 나쁜 답변을 걸러내고 바루는 게 생성형 AI의 최대 과제다. 그래야 상용화할 수 있기 때문이다. 이미 시장에 나온 AI가 여러 개지만 최신 AI의 실용성이 회자되는 건 그만큼 빠르게 진화하고 있기 때문이다.
두 번째 복선은 결국 한글AI를 위해서다. 언제까지 영어AI에 기댈 수는 없다. 체면 문제고 첨단산업 자존심이 걸린 문제다. 그런데 이게 말처럼 쉬운 문제가 아니다. AI가 영어로 활개를 펼 수 있었던 건 순전히 영어가 나열문자인 덕분이다. 조합문자인 한글로는 AI 프로그램을 만드는데 애로가 적지 않다는 게 업계 형편이다. 그래서 국내 AI 기업들은 누가 먼저 한글AI를 상용화하느냐를 두고 지금 박 터지는 전쟁을 벌이는 중이다. 이건 먼저 해내는 기업이 대한민국 AI시장을 독식하는 위너즈테이크올(Winners take all) 게임이라는 것이다.
과기부는 지금 두 마리 토끼를 쫓는 중이다. 영어AI의 위험성을 잡고 한글AI의 가능성을 쫓고. 그런데 AI 기술자들과 국문학자들이 만나면 서로가 서로의 말을 알아듣지 못한다고 한다. 한국말과 한국말이 합을 이루지 못하고 매사 삐끗 어긋난다는 말이다. 어쩌면 AI는 알파벳 같은 나열문자에만 적합한 프로그램일지도 모른다. 그게 기정사실로 확인된다면 한글AI로 위너의 꿈을 품은 자들은 호접몽(胡蝶夢)이나 양껏 꾼 것밖에 되지 않을진저. 한글AI가 호접몽에 그칠지 황금을 낳는 거위일지 자못 궁금치 않은가.