우리나라 AI 산업에 대한 소고

AI EXPO 2025를 다녀와서

by FRAC

AI의 꽃은 무엇일까? 지금은 ChatGPT나 Gemini 같은 생성형 AI가 될 테지만, 그 이전으로 돌아간다면 AI의 꽃은 NeurIPS, ICML, ICLR, CVPR, ACL 등의 최상위 학회에 등록된 논문이 아니었을까? 한다. AI를 심각하게 공부했던 사람이라면, AI를 움직이는 것은 논문이었다는 사실에 완전 동의할 것이다.


논문 이야기를 하는 이유는 당연히 오늘의 주제인 AI 산업과도 관련이 있다. 나는 AI 산업이라는 것이 ChatGPT 이전에는 거품이 잔뜩 껴있는 연평균 성장률(CAGR) 그래프로 표현된다고 생각했다. 그 이유는 AI가 사람의 지능적 행동(특히 이 행위가 단순하지 않다)을 대체할 수 있다는 가능성을 계속 봐왔기 때문이다. 그러나 당시의 AI 도입은 그렇게 쉬운 과제가 아니었다. 지식 노동의 대체는 필연적으로 직업의 소멸과도 이어지고, 또한 AI 잘못을 누가 책임져야 하는지도 불분명했기 때문이다. 따라서 AI가 어디까지 왔는지를 확인하기 위해서는 글로벌 컨설팅 기업의 30년 뒤 AI 시장 전망보다, 최고의 학회에서 수상 받은 논문을 읽는 것이 트렌드를 파악하기가 더 편했다.


우리는 이미 생성형 AI라는 핵폭탄을 맞았다.

아무튼 이제는 생성형 AI를 배제하고 AI를 말하기는 어려운 세상이 됐다. OpenAI나 구글은 얼마나 체감하고 있을는지 모르겠지만, 그들은 정말 고래 싸움을 하고 있다. 정말 소수의 고래 몇몇만 빼고는 살아남을 수 없는 바닷속 전장에서, 대부분의 국가들은 파도에 휩쓸리는 미약한 물고기에 불과하다. 솔직히 조금 어이없는 것은 현재의 정책 결정자들이 생성형 AI 경쟁 구도를 너무 쉽게만 보는 것 같다. 대응은 이미 늦었고, 우리는 생성형 AI라는 핵폭탄을 맞고 방사능에 시름하고 있다는 사실조차 인정하지 않는 듯하다.


왜 이러한 해석을 하게 됐는지 나름 이야기를 풀어보도록 하겠다. 나는 논문을 읽고 AI 트렌드를 정리하는 것을 즐겨했던 사람이다. 물론 연구자로서는 새로운 논문을 작성하는 것이 가장 큰 덕목이겠지만, 당시의 나도 지금의 나도 솔직히 읽는 것만으로도 벅차다. 이러한 관성 탓인지 나는 산업을 움직이는 것은 곧 논문이라는 생각을 가지게 되었고, 또 솔직히 맞는 구석도 있었다.


그러나 시간이 흘러 ChatGPT가 활개 치기 시작하는 2023년부터 나는 전문대학에 임용되어 학교에서 생활하게 되었다. 전문대에 오고 나서는 학생들의 취업처를 알아보기 위해 당연히 AI 산업에 대해서 공부해 보기 시작했는데, 생성형 AI가 나온 만큼 이제 논문으로 산업을 예단하지 않고 산업 그 자체를 보려고 했다. 그 와중에 익히 들어왔었던 연중행사인 AI EXPO KOREA(이하 AI EXPO)에 참관해 보기로 결정했다. 2023년에는 임용되고 바쁘다는 이유로 스킵했지만, 2024년부터는 꼬박 엑스포에 참여하여 우리나라의 AI 산업을 조망해 보기로 했다.


AI EXPO는 뭔가 빠져있다.

서두에서부터 분명히 밝히자면, 나는 AI EXPO를 참여한 국내 기업을 비판을 하자는 것이 아니다. 그저 AI EXPO로 느껴지는 전반적인 흐름으로 비어있는 공간을 읽을 뿐이다. AI EXPO에는 대기업이 빠져있다. 우리나라에서 AI를 가장 잘하는 곳을 두 군데만 꼽으라고 한다면, 나는 삼성과 네이버를 선택하겠다. 이 둘이 가지고 있는 영향력은 이미 논문에서도 확인을 했었고, 실제로도 자생할 수 있는 기술력을 갖췄다고 본다. AI EXPO에는 이 둘을 찾아볼 수가 없었다. 오히려 이들을 포함한 국내 유수의 대기업은 CES에 적극적으로 참여했다. 어떻게 보면 AI는 그 자체로 글로벌 경쟁이니 작디작은 내수시장을 공략하기에는 가성비도 나오지 않을 것으로 추측했다.


대기업의 참여가 거의 없을지라도 AI EXPO는 우리나라 AI 산업의 현주소를 가늠하기에도 좋은 바로미터다. 하물며 나는 어떻게 AI 산업이 돌아가는지를 알아야 학생들을 어떻게 가르쳐야 할지에 대해 감을 잡을 테니 말이다. 그렇게 2년간 엑스포에 참여하면서 우리가 외면하고 있는, 또한 정책 결정자들이 보고 있지 않은 현실에 대해서 언급해보고자 한다.


거대 언어 모델의 틈새시장

거대 언어 모델의 정의는 어떻게 하면 좋을까? 나는 내 전공을 살려 "계산량"으로 정의했다. 거대 언어 모델의 시작은 2020년 OpenAI의 GPT-3로부터 출발한다고 보면 된다. GPT-3의 규모는 학습 데이터로 최적화되는 일종의 모수(파라미터)가 1,750억 개로 구성된다. 1,750억 개가 얼마나 무지막지하냐면, 저 정보를 "저장"하는 행위만으로도 700기가바이트의 공간을 필요한다. 하물며 저러한 모수를 통해 계산을 한다면야 보통의 컴퓨터로는 택도 없는 소리일 것이다. 한 연구에 따르면 GPT-3가 사람 수준의 언어 구사능력을 학습하기 위해 필요한 계산량은 3.14 x 10^23번이라고 밝혔다. 우리가 읽는 수의 단위로 표현하자면 3,140해 번의 계산(대부분 곱셈+덧셈으로 보면 된다)이 필요한 것인데, GPT-3을 오픈소스로 구현하여 공개한 메타의 OPT-175B 논문에 따르면 NVIDIA A100 992장을 활용해 33일 정도 학습한 것으로 추정된다. A100이 대략 3천만 원 수준이라면 GPU값만 300억 원 수준이다. 거대 언어 모델은 공개 당시부터 이미 연구의 수준을 벗어나 인프라를 감당할 수 있는 소수의 전유물이었으며, 그것을 잘 활용할 수 있는 인재가 밑받침되어야 한다는 사실은 이미 넘사벽의 세계를 구성했다고 봐도 무방하다.


거대 언어 모델은 GPT-3을 기점으로 규모의 경쟁에 돌입하는데, 우스꽝스럽게도 군비경쟁을 방불케 했다. 구글의 PaLM은 540B, 화웨이의 판구 시그마는 무려 1T까지 올라섰다. 끝이 없이 지속될 규모의 경쟁은 2022년 11월 30일 ChatGPT가 등장하고 나서야 끝나게 됐다. 사실 끝이라기보다는 새로운 시작이라고도 볼 수 있겠다. 규모의 경쟁을 실시간으로 경험했던 사람으로서 이야기하자면, 거대 언어 모델은 성능은 좋지만 엄청난 전기를 잡아먹는 공룡이었다. 실제로 서비스를 한다는 것이 불가능해 보일 정도로 가성비가 안좋아보였으나, 이것은 기술적으로 충분히 최적화가 가능할 것이라고 봤다. 그러나 더 심각한 것은 인류가 AI에게 도덕성을 요구했다는 것이다. 즉, 유해한 발언은 최대한 삼가고, 편향적인 대답을 에둘러 표현하는 안전망이 있어야 서비스가 될 수 있다는 사실이었다. ChatGPT는 그러한 어려움을 뚫고 나온 것이다. 그 과정에는 소위 인간의 피드백을 통한 강화학습(Reinforcement Learning from Human Feedback)이라는 것으로 InstructGPT가 있었다. 당시 논문을 보면 편향은 잡기 어려웠다는 결론이 나오는데, ChatGPT는 그것마저 해결하고 대중에 소개된 것이다.


ChatGPT 이후는 모두가 잘 아는 내용일 것이다. 이것으로 무려 주가가 올랐으니 유튜브에는 AI 연구자가 아닌 투자자의 분석이 흘러넘쳤다. OpenAI가 일으킨 바람은 빅테크에서도 예외는 아니었다. 특히 코로나로 인해 Meta로 기업명까지 바꾼 Facebook은 거대 언어 모델에서 후발주자로 출발했다. Meta의 접근은 단순했다. 거대 언어 모델은 너무 크니 사이즈를 줄이면서도 성능을 유지할 수 있는 방법을 만들어 냈다. 그 결과물이 LLaMA이고 무려 오픈소스로 공개했다. 그리고 AI 커뮤니티에서는 이를 지칭하는 아주 이상한 단어로 sLLM(smaller Large Laguage Model)을 택했다. 엄밀히 말하면 LLaMA는 모델의 모수를 줄이는 대신 학습하는 데이터의 양을 무지막지하게 늘린 것으로 "계산량"의 관점에서는 거대 언어 모델에 속한다.


Meta가 LLaMA를 출시하자 연구자들은 새로운 가능성을 봤다. ChatGPT보다는 못하지만 그래도 꽤 괜찮은 언어 모델을 내 컴퓨터에서도 실행시킬 수 있다는 점이 매력적이었다. LLaMA 이후 전 세계에서는 그야말로 오픈소스 sLLM 붐이 일어났다. 크기는 더 작게, 그러나 성능은 더 우수하게 경쟁한 결과 2022년 11월 30일에 나온 ChatGPT는 이제 스마트폰에서도 구동될 수 있을 정도로 소형화됐다.


기업에서도 새로운 가능성을 맛봤다. 바로 ChatGPT를 정식으로 사용할 수 없는 기관에서 내부 용도로 사용하거나, ChatGPT의 API 비용을 대체하기 위한 방편으로 sLLM 도입을 타진했다. 우리나라의 다양한 AI 기업도 이 접근을 취하고 있다. 2024년과 2025년 AI EXPO의 1/3 이상은 모두 sLLM 최적화를 사업 아이템으로 들고 나왔다.


이런 틈새시장을 잡는 것에 불만이 있는 것은 아니다. 그러나 어쨌든 빅테크가 개발한 sLLM의 기술적 종속이 있을 뿐인 것이다. 아무리 sLLM이라고 해도 사용자가 몰리면 감당이 안되니 GPU가 필요해졌다. AI EXPO의 절반 이상이 GPU 서버 기업이었다는 사실로 미루어본다면 참으로 허탈한 대목이 아닐 수 없다.


2025년 AI EXPO를 다녀오며

지난달 나도 2025 AI EXPO에 다녀왔다. 학과 졸업생들의 취업처도 탐색해 볼 겸 삼성역 코엑스에 방문했던 나는 놀라지 않을 수 없었다. 줄이 길어도 너무 길어 이게 무슨 일인가 싶을 정도였다. 아마 주가가 올랐으니 AI 대한 관심도가 더 높아졌지 않았나 싶은 생각도 들었다. 그렇게 투덜대며 입장했지만 작년과 크게 달라진 점은 없어 맥이 빠지긴 했다.


여전히 온통 GPU 서버 판매에 열을 올리고 있었고, 맞춤형 sLLM 개발은 여전했다. 데이터 분석 자동화는 어김없이 등장했으며, 데이터 분석을 연구 주제로 삼고 있는 나에게는 여전히 의문을 갖는 대목이었다. 내가 생각하는 데이터 분석의 핵심은 도메인 지식의 습득과 데이터의 정합성을 확보하기 위한 과정이라고 보는데, 그것을 기계가 알아서 해준다니? 지금의 ChatGPT도 못하는 것을 어떻게 한다는지 도무지 이해가 안 갔다.


바뀐 풍경은 한 가지 정도 있었다. AI 기본법이 통과되어 인증 검증 시장의 움직임이 눈에 띄게 보였다는 것이다. 전문대 졸업생의 취업처로도 나쁘지 않았기에 열심히 알아보긴 했지만 이제 막 시작 단계인터라 큰 소득은 없었다.


결론적으로 나는 여기에 온 일반 관람객들이 어떠한 인상을 받았을지가 너무 궁금했다. 나에게는 온통 그 밥에 그 나물처럼 보이긴 했으나, 분주하게 돌아다니며 감탄하고 있는 사람들을 보니 내가 우리나라 AI 산업을 너무 냉소적으로 보는 게 아닐까 싶은 생각도 들었다. 어떻게 보면 내가 가르친 학생들이 취업할지도 모르는데 말이다. AI EXPO가 잘못한 것은 없지만 AI 3대 강국이 더욱 초라하다는 생각이 든다.



긴 글 읽어주셔서 감사합니다.

keyword
작가의 이전글AI 3대 강국에 대한 사견 (2부)