brunch

AI 반도체 판도, NPU가 바꾼다

조용한 반란: NPU가 이끄는 새로운 AI 시대

by 윤세문

AI 기술이 빠르게 확산되며, GPU는 'AI 연산의 엔진'으로 자리 잡았다. 특히 OpenAI의 GPT 모델 훈련에 쓰인 엔비디아 GPU는 AI 훈련 시장 점유율의 90% 이상을 차지하며 절대적인 지위를 유지하고 있다. 하지만 지금, 조용하고도 확실하게 새로운 주인공이 등장하고 있다. 바로 NPU(Neural Processing Unit)이다.


GPU와 NPU, 무엇이 다를까?

npu gpu.PNG


GPU는 대규모 데이터를 병렬 처리하는 데 최적화되어 있어 AI 모델 훈련(training)에 강점을 보인다. 반면, NPU는 AI 모델 추론(inference)을 실시간으로 수행하는 데 최적화된 반도체이다. 가령, 스마트폰에서 사진을 자동 보정하거나, 음성 인식을 통해 Siri가 반응하고, 얼굴 인식을 통해 잠금이 해제되는 것도 NPU의 역할이다.


output.png GPU와 NPU의 시장 projection. 아직은 GPU가 압도적으로 높으나, NPU의 성장세가 가파르다


그런데, NPU는 학습도 할 수 있을까?

결론부터 말하면 NPU는 학습보다는 추론(inference)에 최적화된 칩이다. GPT-4나 Gemini 같은 초거대 모델의 훈련(training)은 여전히 GPU나 TPU (Tensor Processing Unit)가 맡고 있다. 이는 모델 학습이 고정밀 연산과 대규모 메모리, 유연한 프로그래밍 환경을 요구하기 때문이다. 하지만 최근에는 일부 고성능 NPU가 파인튜닝 수준의 소규모 학습까지도 시도되고 있다. 다만 GPU는 앞으로도 초대형 AI 모델을 학습하는 데 필수적인 존재로 남을 것이다.


왜 지금 NPU인가? — 엣지 시대의 시작

AI가 클라우드에서만 실행되는 시대는 지났다. 스마트폰, 자율주행차, 공장 설비 등 '엣지 디바이스' 자체에서 AI가 작동해야 하는 시대가 열렸다. 이 흐름에서 NPU는 다음과 같은 이유로 주목받고 있다:

✅ 저지연 처리: 클라우드 왕복 없이 현장에서 즉시 판단 가능

✅ 에너지 효율: 배터리 기반 기기에서 효율적 작동

✅ 데이터 보호: 민감한 정보의 로컬 처리 가능


예를 들어, 애플 아이폰은 Neural Engine으로 사진 보정, Siri 응답, Face ID 등을 서버와의 교류 없이 처리한다. 테슬라는 차량 내 NPU 칩으로 도로 상황을 실시간으로 판단한다. 그리고 국내에서는 딥엑스, 퓨리오사AI 등 스타트업들이 공장, 로봇, CCTV 등 다양한 엣지 환경에서 NPU를 활용하고 있다.


시장 전망: GPU를 보완하거나 넘어서다

현재: 전체 AI 반도체 시장에서 NPU 비중은 아직 5% 미만이지만, 엣지 시장 수요로 급성장 중

예상: 글로벌 NPU 시장은 2030년까지 약 100억 달러 규모로 성장 예상 (연평균 성장률35~40%)


GPU가 AI의 심장이었다면, NPU는 AI의 손과 발처럼 사용자 가까이에서 AI를 작동시키는 핵심 기술이 될 것이다.


한국의 기회: 왜 NPU에 강한가?

한국은 글로벌 NPU 생태계에서 의미 있는 강점을 가지고 있다

하드웨어 역량: 삼성전자 등 세계적 반도체 제조 역량 보유

현장 지향성: 제조업 기반으로 엣지 AI 적용 수요 높음

기술 스타트업들:

- 딥엑스: 초저전력 NPU로 글로벌 가전 시장 등 공략 중

- 퓨리오사AI: 데이터센터용 NPU 개발, MLPerf 벤치마크 상위권

- 리벨리온: 금융/통신 특화 NPU, KT등과 협력 확대 중


미래에도 GPU는 여전히 중요한가?

그렇다. AI는 한 번 학습하고 끝나는 기술이 아니다. 환경 변화, 사용자 행동, 새로운 언어·데이터 등장에 따라 모델은 지속적인 재학습(fine-tuning, continual learning)과 업데이트가 필요하다. 즉, AI가 현실에서 제대로 작동하려면 GPU 기반의 훈련 환경은 계속 필요하다.


또한, 생성형 AI처럼 수억 개의 파라미터를 가진 모델을 처음부터 훈련하려면 여전히 GPU의 고성능과 대규모 병렬 처리 능력이 필수이다. 따라서 미래 AI 인프라는 GPU와 NPU가 함께 쓰이는 구조, 즉 학습은 GPU, 추론은 NPU가 맡는 역할 분담 체제가 공고화될 것이다.


마무리 하며

AI의 주 무대가 클라우드에서 현장(엣지)으로 이동하면서, NPU는 새로운 시대의 핵심 반도체로 부상하고 있다. GPU의 시대는 계속되겠지만, NPU는 그 옆에서 더 빠르고 효율적인 AI 세상을 가능하게 할 핵심 기술이다.


한국은 지금 NPU 기술과 산업 기반을 모두 갖춘 몇 안 되는 나라이다. 이 기회를 전략적으로 활용한다면, 글로벌 AI 반도체 시장에서 독자적 입지를 확보할 수 있다. 지금이 바로 'GPU 이후'를 준비할 때이다.

keyword
작가의 이전글AI 생태계, 우리는 어디에 베팅해야 할까?