brunch

You can make anything
by writing

C.S.Lewis

by Grandmer Aug 14. 2024

AI 예감

AI 비즈니스와 투자를 위한 격이 다른 현장 분석


[ 글을 시작하기 전에 ]


21세기 비즈니스의 중심, 단연코 AI


기업이 번창하고 싶으면 미래 먹거리 투자를 멈춰 선 안 된다. 


엔비디아가 AI시대의 최대 수혜 기업이 돼 AI 생태계를 주도하며 2조 달러가 넘는 시가총액을 자랑할 수 있게 된 비결이 무엇일까?


10여 년 전부터 딥 러닝에 대한 잠재수요를 포착했고, 이에 대비해 병렬 처리에 적합한 GPU를 꾸준히 개발해 왔기 때문이다. 


메모리 반도체 선두주자 SK 하이닉스와 삼성전자가 HBM 시장 선점에 나설 수 있었던 것은 일찌감치 AI 반도체 생태계를 키우기 위한 밑그림을 그린 덕분이다. 


미래 먹거리를 발굴하고 그걸 비즈니스로 구현하려면 산업의 흐름 혹은 트렌드를 파악해야 할 터인데, 지금 글로벌 산업 전개의 중심에는 무엇이 있을까.


단연코 AI다. AI를 활용해 새로운 성장동력을 찾는 게 그만큼 중차대해졌다는 뜻이다. 


동시에 AI시대를 미리 준비해 온 기업과 AI열차를 놓치지 않고 올라탄 기업들은 그동안의 투자를 성과로 바꿀 기회가 왔다는 의미도 된다. 


그럼 AI의 시대 우리는 어떤 기술적 변화를 이해해야 하는지 알아보자. 


Ⅰ. AI, 언제든 어디서든 우리 가까이


챗 GPT와 생성 AI의 등장은 무엇보다 AI에 대한 접근성을 높였다. 누구나 친구와 대화하듯 손쉽게 AI와 소통하면서 AI의 위력을 깨닫고, AI의 도움을 환영하고 심지어 AI로부터 상상력을 자극받게 된 것이다. 


설사 LLM이 완전히 새로운 기술은 아니라 하더라도, 세상을 화들짝 놀라게 하고 AI 생태계의 확대를 촉발한 변곡점이 된 건 부인하기 어렵다.

 

주로 B2B 시장에서 활약하던 AI가 스마트폰, TV, PC 등 개인용 일상 기기로 퍼져나가고 있다. 


이것은 결국 AI의 대중화, AI기술 및 서비스의 초개인화, 그리고 나아가 AX로 불리는 인공지능 전환의 본격적인 출발을 의미한다. 


Ⅱ. AI 산업은 크게 두 개의 축으로 나눠 볼 수 있다. 


AI모델을 개발해 초거대 AI 플랫폼을 구축하려는 빅테크 기업


그런 AI 모델을 기반으로 하는 AI 응용 서비스


챗 GPT 혁명 이후 AI 반도체 등 하드웨어가 급속히 발전해 왔고, 클라우드 서비스 이용도 손쉬워서 어떤 기업이든 쉽게 AI 기술에 접근할 수 있게 됐다. 


더불어 인간의 지능에 점점 가까워지는 AI의 등장으로 AI 생태계가 본격적으로 모습을 드러냈다.


AI가 일상과 산업에서 핵심이 되는 AIoT 시대가 열리기 시작한 것이다. 


생성 AI의 출발점이었던 LLM은 크게 파운데이션 모델과 이를 미세 조정해 만든 파인튜닝 모델로 나뉜다. 


파운데이션 모델은 워낙 만들기가 어려워, 세계적으로도 그런 기술력을 지닌 업체가 손에 꼽을 정도다. 


파운데이션 모델에서 미세조정을 거치면 여러 가지 파인튜닝 모델이 만들어지게 되는데, 그 쓰임새가 다양한다. 


대표적인 파운데이션 모델로는 챗 GPT 혁명을 주도한 장본인 오픈 AI의 GPT 시리즈, 구글의 제미나이, 메타의 라마, 알리바바의 큐원, 네이버의 하이퍼크로버 X 등을 예로 들 수 있다. 


Ⅲ. 오픈 AI, 챗 GPT 혁명 그 이후


오픈 AI가 2018년 출시한 최초의 양방향 파운데이션 모델은 3억 4천만 개의 파라미터와 16GB의 데이터 세트로 훈련되었다. 이 챗 GPT는 모델이 매개변수 1,750억 개의 GPT 3.5였다. 


이어 2023년 3월에는 1조 개의 매개변수와 45GB의 훈련 데이터 세트로 학습시킨 GPT-4 버전을 공개했다. 


그와 동시에 기업용 챗 GPT를 출시하며 수익화에 나섰고 여기에 달리 3을 통합하기도 했다. 


GPT-4 Turbo는 GPT-4에 비해 60% 이상 저렴해졌으며 최대 300페이지 분량의 텍스트를 단번에 처리할 수 있다. 


지금 AI 업계는 GPT-5를 학수고대하고 있다. 매개변수가 GPT-4의 100배 이상인 125조 개에 달한다는 소문까지 나도는 차세대 파운데이션 모델 GPT-5는 2024년 하반기 발표될 것으로 보인다. 


GPT-5는 추론 및 계획의 기능까지 갖춤으로써 인간 수준의 AGI에 도달할 것이라고 평하기도 한다. 


과연 스스로 진화해 인간의 지적 수준을 능가할 만한 AI 모델인지, 궁금하다. 


Ⅳ. 구글 '제미나이'로 생태계 일원화


구글이 AI전략은 Gemini 생태계 확립이 뼈대를 이룬다. AI 챗봇 바드를 출시하고 추론과 코딩 능력을 강화한 PaLM2 등 신형 LLM으로 반격했다. 


인터넷 사용률이 높고 구글 검색의 강력한 경쟁자가 있는 시장을 먼저 겨냥해 한국어와 일어 서비스도 추가했다. 하지만 효과는 미미했다. 


매개변수 크기에 따라 울트라, 프로, 나노의 3개 모델로 나뉜 제미나이는 최상위 모델 울트라의 매개변수가 1조 5,600억 개로 현재 업계에서 가장 앞섰다는 오픈 AI의 최상위 모델 GPT-4에 필적하는 수준이다. 


GPT-4 대항마로 출시한 제미나이는 새로운 범용 LLM인데, 설계 단계부터 멀티 모델 기능을 지향한 첫 모델이다. 


모바일 기기부터 전문 데이터센터까지 모든 환경에서 텍스트, 오디오, 이미지, 동영상, 코드 등 다양한 모드의 정보를 효율적으로 처리한다. 


40개 이상의 언어 구사는 물론이고, 무엇보다 추론, 이해, 창작 능력을 갖추었다는 게 가장 큰 특징이다. 


이미지 인식의 수준을 넘어 대상의 속성과 특징까지 파악 추론하고 수학 문제까지 척척 풀어낸다. 


가령 사과와 쿠키 이미지를 보면 쿠키보다는 사과가 건강에 더 좋다는 판단까지 한다. 


구글은 일반 사용자에 개발자까지 아우르는 제미나이 지원 체계를 갖춰 챗GPT와 경쟁한다. 


제미나이는 멀티 모델 AI의 성과와 안전성에 따라 제조와 IT는 물론이고 의료, 교육 등 전 산업에 파급 효과를 미쳐 생성 AI 2.0 시대를 불러올 수 있다. 


Ⅴ. 메타, 추론하는 AI 공개


추론하는 AI의 출현은 AI 선업의 발전 패턴 자체를 바꿀 수 있다. 운전을 예로 들어보자. 


사람은 운전 방법을 20시간 정도만 배우면 다양한 상황에 대응하면서 운전할 수 있다. 


그러나 지금의 AI는 운전 방법뿐만 아니라, 운전 중에 생길 수 있는 모든 경우의 수를 완벽히 사전 학습하지 않고선 운전할 수 없다. 


그래서 완전 자율주행이 그토록 어려운 거다. AI가 추론과 계획 능력을 갖추어야만 사람처럼 우선순위도 정하고 합리적 판단을 내리며 운전할 수 있게 된다. 


Ⅵ. 미스트랄, 챗 GPT의 유럽 버전?


미스트랄은 지중해 북쪽에서 바다를 향해 부는 바람의 이름으로 AI 업계에 프랑스의 새 바람을 불어넣겠다는 의지가 담겼다. 


불과 9개월의 연구 끝에 태어난 미스트랄 라지는 GPT-4에 가깝다. 어떤 부문에선 제미나이나 라마보다 성능이 뛰어나다 등의 찬사를 받는 LLM이 되었다. 


게다가 Le Chat이라는 챗봇까지 출시해, 소규모 팀치고는 기술 수준이 세계 최고라는 소리도 듣는다. 


특히 미스트랄 라지는 가격까지 저렴해서 속칭 가성비가 최고인 모델이다. 미스트랄은 설립 10개월 만에 몸값이 20억 유로로 껑충 뛰었다. 


미스트랄에 투자한 MS의 의도는 뭘까. 유럽 기업을 끌어들여 미국 중심 LLM 기술 생태계를 다변화하겠다는 뜻이리라. 


주요 AI 모델은 지금까지 실리콘 밸리 중심으로 개발되어 왔지만, 앞으로 각국에 특화된 AI모델이 많이 나올 것이다. 


Ⅶ. 언어모델의 치열한 다이어트, 맞춤형으로 진화하는 sLLM


국내 AI 스타트업 업스테이지가 개발한 sLLM 솔라의 매개변수는 불과 107억 개, GPT-4와 비교하면 100분의 1 수준이다. 


그 외에 미스트랄 7B, 스테이블 LM, 큐원 72B 등 세계 여러 국가에서 속속 등장하는 AI모델들도 모두 가벼운 몸집의 경량 거대언어 모델이다. 


이들은 매개변수가 수백억 개에 불과한 경량 언어모델이지만 컴퓨팅 리소스 요구사항이 적어서 효율성이 높은 데다, 훈련과 운영 비용도 적게 들어서 여러모로 잠재력이 상당하다. 


특히 배포하기 쉬운 대안을 찾을 때 유용한 AI모델이다. 그래서 모든 문제를 딱 한 가지 모델로 해결하겠다고 시도하는 대신, 당장 기업에 큰 부담이 안 되는 선에서 사용할 만한 소형 AI모델들이 하나둘 빠르게 생겨나고 있다. 


이 같은 AI 경량화 트렌드는 기기 자체에서 AI연산을 처리하는 온디바이스 AI와 서로 궁합이 잘 맞아서 동전의 양면과 같다. 


그래서 시간이 흐를수록 LLM 만큼이나 중요한 것으로 인식되고 있다. 이는 AI기술의 실용적 측면이 갈수록 두드러지는 과정인 동시에 생성 AI의 대중화 일상화를 본격적으로 앞당기는 역할을 하고 있다. 


Ⅷ. 텍스트 졸업한 AI, 다음 단계는 VFM


전통적으로 AI기술은 자연어를 처리하는 언어 분야와 이미지를 처리하는 비전 분야, 이렇게 두 갈래로 발전되어 왔다. 


언어 분야 : 2017년 구글이 Transformer 알고리즘을 내놓은 이후 급격하게 발전했다. 2022년 말 GPT-3.5란 LLM을 기반으로 챗 GPT가 나오면서 순식간에 세계로 확산했다. 


버전 분야 : 마차가지로 대규모 이미지를 이용해 만든다. 트랜스포머 알고리즘을 이미지 분야로 확장한 ViT (비전 트랜스포머) 알고리즘이 등장하면서 성장의 계기를 맞았다. 


이미지 기반의 초거대 AI인 VFM (Vision Foundation Model)이 최근 빠르게 발전하고 있다. 


학습된 데이터를 기반으로 LLM이 창작, 요약, 번역 등을 수행하듯이, VFM은 이미지에 담긴 사물을 구분 분류하고 전체 상황도 인식한다. 


클릭 한 번으로 이미지의 특정 영역을 쉽게 분리하는 메타의 SAM (Segment Anything Model) 자연어로부터 시각적 개념을 효율적으로 배우는 오픈 AI의 신경망 CLIP, 이미지와 텍스트를 논리적으로 연결하는 구글의 OWL-ViT 등이 대표적인 예다. 


Ⅸ. 온 디바이스 AI


각종 전자기기 자체에 고성능 AI가 탑재되어 있어서 굳이 인터넷과 연결되지 않아도 즉, 데이터를 외부 서버로 전송하지 않아도 개인 맞춤형 서비스를 실시간으로 제공할 수 있는 기술을 가리킨다. 


물론 예전에도 비슷한 기능을 가진 기기들은 있었고, 사실 스마트폰이나 가전 시장에서 AI가 필수 기능이 된 것은 꽤 오래된 얘기다. 


AI스피커는 인간과 간단한 대화를 주고받았고, AI기능을 탑재한 냉장고나 세탁기 따위도 출시되었다. 


하지만 이제 훨씬 더 진화한 생성 AI가 탑재되면서 IT 기기들이 전례 없이 똑똑해졌다. 


이젠 AI 구동 방식에 관해 이런 질문을 해야 할 것 같다. 소중한 데이터를 클라우드로 갖다 놔야 할까, 아니면 기기 자체에 저장해 활용할까?


전부를, 아니면 필요한 일부만?


클라우드 중심의 기존 범용 AI 서비스는 온디바이스 AI 기술에 힘입어 맞춤형 서비스로 진화할 것이다. 


디바이스 자체에서 AI연산을 수행한다는 건 인터넷이나 클라우드 연결이 없어도 된다는 뜻이니, 전력 소모도 적고 데이터 보안도 더 튼튼해질 수 있다. 


나만의 데이터를 안전하게 활용해 쓸 수 있으니 고도의 맞춤형 서비스가 가능하다. 


이 같은 온디바이스가 AI가 스마트홈 방식으로 구현되면 사용자가 말하지 않더라도 모든 제품이 알아서 정보를 주고받고 작동하게 되지 않겠는가.


AI가 우리의 삶을 빙 둘러싸는 앰비언트 환경이 이루어질 것이다. 


[ 글을 마치며 ]


AI에 대해서 앞서 말한 내용을 세 가지로 나눠서 다시 생각해 보도록 하겠다. 


첫 번째는 모든 빅 테크 기업이 인공지능 개발에 뛰어들고 있다는 것이다. 


인공지능은 이제 개발하지 않으면 안 되는 기술이 되었다. 


최근 구글의 CEO인 순다르 피차이가 말했듯이 인공지능에 대한 과도한 투자는 미래에 뒤처지는 것보다 오히려 안전하다고 말을 했다. 


지나가는 말로 치부할 수 있지만 실제로 인공지능 개발 자체가 먼 미래에 먹거리가 될 것으로 개발하는 일로 어떤 형태로 나타날지 누가 선점하게 될지는 모를 일이다. 


하지만 누군가가 먼저 선점하고 사용자를 끌어들이고 네트워크 효과를 만들어내게 된다면 그 이후에 시장을 다시 선점하는 것은 매우 어려운 일이기 때문이다. 


이런 점을 고려해 볼 때에 모든 빅테크 기업은 인공지능 개발에 모든 역량을 쏟아붓고 있다고 해도 과언이 아니며 앞으로도 이 흐름은 지속될 것이라는 점이다. 


최근 수십 년간 발전하는 기술을 바탕으로 성장하는 기업들로 분류되며 사상 최고의 추가를 구가하던 기업들이 자신들의 보유한 모든 역량을 쏟아부어 개발한다는 것 자체가 인공지능의 미래를 밝게 하는 첫 번째 단서라고 생각한다. 


두 번째는 이미 사용을 경험한 이들이 있고 이들로 인해서 더 많은 발전이 나타나고 있다는 것이다. 


인공지능을 사용한 사람들은 과거에 B2B 산업의 종사자들이었다. 


월가의 트레이더들은 이미 오래전에 인공지능으로 대체되었고 아마존의 물류센터와 알리바바의 물류센터는 인공지능으로 동작하게 된 지 오래다. 


이후 구글을 통해서 인공지능 알고리즘은 우리를 더 편한 검색의 세상으로 이끌어주었다. 


이런 경험을 바탕으로 더 많은 다수의 사람들의 인공지능을 활용하는 것을 꿈꾸게 되었고 이런 수요를 반영하듯이 나타난 것이 챗 GPT이다. 


챗 GPT는 마치 개인 비서와 같아서 나와 대화를 하면서 나에 대해서 학습하고 이해하고 이를 통해서 나에게 적합한 대답을 해준다. 


시간이 가면 갈수록 점점 더 많은 정보가 쌓이게 되고 더 심도 깊은 대화를 할 수 있게 될 것이다. 


이를 토대로 생각해 보면 인공지능의 개인화 맞춤화는 이미 시작되었다고 볼 수 있다. 


앞으로는 이를 더 발전시키기 위해서 경량화 인공지능의 출현이 많아질 것이라 생각한다. 


마지막 세 번째는 온 디바이스 AI와 IoT의 영역이 넓어진다는 것이다. 


AI를 더 쉽게 편하게 저렴하게 활용하기 위해서는 온 디바이스 AI가 필요하게 된다. 


온 디바이스 AI는 다운로드를 하여두고 활용을 하다가 정기적으로 업데이트를 하는 형태로 활용하게 될 것이다. 


개인 데이터의 보안의 문제도 해결해 줄 것이지만 특히 최근 가장 큰 문제가 되고 있는 인공지능의 활용에 따른 비용 문제를 크게 개선시켜 줄 것이다. 


이는 AI의 범용화를 가능하게 해 줄 것이고 더 많은 AI를 활용할 수 있는 시대에 살 수 있게 될 것이다. 


그리고 AI의 시대는 모든 사물의 발전도 요구하게 될 것이다. 


기존의 반도체 칩이 제공하지 못하는 새로운 Spec을 요구하게 될 것이고 이에 따라 새로운 시장이 더 많이 창출될 가능성이 있다고 생각한다. 


인공지능과 관련된 정보와 지식은 많이 알아두면 알아둘수록 좋다고 생각한다. 


몇 번에 걸쳐서 정리해야겠다. 

참고 도서 : AI 예감 ( 권기대 )


작가의 이전글 나의 직업은 부자입니다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari