brunch

You can make anything
by writing

C.S.Lewis

by OOJOO Nov 29. 2024

AI, 학습용에서 추론용으로 변화

추론용 AI가 가져올 시장 변화

2024년 9월 OpenAI는 'o1'이라는 혁신적인 추론 특화 AI 모델을 발표했다. 이 모델은 기존의 GPT 계열과는 차별화된 추론 중심의 아키텍처를 채택했다. 기존 Large Language Model(LLM)들이 확률적 언어 모델링(Probabilistic Language Modeling)에 기반했다면, o1은 인과관계 추론(Causal Reasoning)과 논리적 연계성에 중점을 둔 것이다. 즉, 기존의 학습 기반 모델들은 트랜스포머(Transformer) 아키텍처를 통해 방대한 말뭉치(Corpus)에서 통계적 패턴을 학습하여 다음 토큰을 예측하는 방식으로 작동한다. 이는 본질적으로 패턴 매칭(Pattern Matching)과 확률 분포 기반의 접근법이다. 반면 추론 특화 모델은 Neuro-Symbolic AI 기술을 활용하여 입력된 프롬프트의 의미론적 구조를 파악하고, 다중 추론 체인(Multi-hop Reasoning Chain)을 통해 복잡한 문제해결 과정을 수행한다.


이러한 근본적인 차이는 필요 인프라스트럭처에도 반영된다. 학습용 모델은 대규모 병렬 처리가 가능한 NVIDIA H100, H200과 같은 고성능 GPU 클러스터와 SK하이닉스의 HBM3/HBM3e 메모리, 100MW 이상의 전력 공급, 고효율 액체 냉각 시스템(Liquid Cooling System)이 필수적이다. 반면 추론용 모델은 Google의 TPU, Amazon의 Trainium/Inferentia, 삼성의 NPU 등 용도별로 최적화된 AI 가속기와 30-50MW 수준의 전력, 통상적인 공랭식 냉각 방식으로도 충분한 운용이 가능하다. 즉, 학습용을 위한 데이터센터와 추론용을 위한 데이터센터의 설계와 위치는 다를 수 있다는 점이다. 학습용은 고전력의 에너지를 필요로 해서 대도시보다는 지방이나 오지(산, 지하, 바다, 사막 등)에 위치하는데 반해 추론용은 저전력의 효율성을 중요시하기에 공장이나 기업, 기관 인근에 위치할 수 있다. 마치 대규모 변전소가 도심 외곽이나 전력 인프라가 잘 갖춰진 넓은 부지에 설치되는 반면, 소규모 전력 분배함 즉 지역, 건물 전력 공급 장치가 도심 곳곳에는 분산되어 설치되는 것과 같다.

LLM의 학습에 필요로 하는 고성능의 컴퓨팅 인프라


더 나아가 앞으로 주목할 만한 점은 추론용 모델의 분산 처리 가능성이다. 제조 공장과 산업용 로봇 그리고 자율주행차나 스마트폰, 드론 등에 적용되어 디바이스의 성능과 편의성을 극대화할 수 있는 추론 모델에 대한 기대가 커지고 있다. 클라우드 기반으로 제공되는 학습 혹은 추론 모델은 근본적으로 비용과 보안, 속도 그리고 최적화 부분에 있어 한계가 있다. 비록 추론용 모델이 학습에 비해 자원을 덜 사용한다 하더라도 클라우드 기반으로 작동되기 때문에 돈이 들고, 개인정보 보호 측면에서 신뢰의 문제가 있다. 또한 인터넷으로 데이터가 오가면서 정보를 처리해야 하는만큼 지연 시간이 있으며, 모든 사용자별 그리고 용도별로 완벽한 맞춤 개인화는 불가능하다.


반면, 엣지 디바이스 내에 추론용 AI 모델이 탑재되면 이러한 제약에서 자유로워진다. 디바이스에서 직접 데이터를 처리하므로 클라우드 서버 비용이 들지 않고, 민감한 개인정보가 외부로 전송되지 않아 보안성이 높다. 특히 밀리초(ms) 단위의 즉각적인 응답이 필요한 자율주행이나 산업용 로봇 제어와 같은 실시간 애플리케이션에서 큰 강점을 발휘한다. 이는 자율주행차가 교통 상황을 즉각적으로 분석하거나, 스마트폰이 네트워크 연결 없이도 복잡한 AI 작업(예: 이미지 보정, 음성 인식)을 수행할 수 있도록 한다. 더불어 각 디바이스의 특성과 사용자의 패턴에 맞춰 AI 모델을 최적화할 수 있어, 더욱 정교하고 개인화된 서비스 제공이 가능하다. 결과적으로, 엣지 디바이스에 최적화된 추론용 AI 모델은 사용자 경험을 혁신적으로 향상시키며, 특정 산업과 용도에 맞는 완벽한 맞춤형 솔루션을 제공할 수 있는 중요한 기술로 자리 잡게 될 것이다.


이렇게 2년차를 맞이한 AI 시장은 학습 중심에서 추론 중심으로 점차 변화하고 있다. 학습 모델이 대규모 데이터를 통해 AI의 기본 역량을 구축했다면, 추론 모델은 이를 바탕으로 실제 응용에서 사용자 경험과 문제 해결을 극대화하는 데 초점을 둔다. 특히, 엣지 디바이스에서의 추론 모델 활용은 개인화된 경험, 에너지 효율성, 실시간성을 강화하며, AI가 인간의 삶에 더욱 밀접하고 실질적인 가치를 제공하는 시대를 열어줄 것이다.


➡ 작가의 IT 트렌드에 대해 집필한 서적

https://www.yes24.com/Product/Goods/133327806


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari