NPU — AI가 주머니 속으로 들어온다

보이지 않는 전쟁 제7회

by 조종주

NPU — AI가 주머니 속으로 들어온다

보이지 않는 전쟁 제7회


80, 60, 50, 38.

2026년 CES에서 가장 많이 들린 숫자들입니다. 단위는 TOPS(Tera Operations Per Second), 초당 1조 회의 AI 연산을 뜻합니다. 퀄컴 80, AMD 60, 인텔 50, 애플 38. 이 숫자들은 GPU가 아닙니다. 노트북과 스마트폰에 들어가는 NPU(Neural Processing Unit), AI 전용 칩의 성능 경쟁입니다.[7-1]

6회까지 우리는 데이터센터의 거대한 전쟁을 다뤘습니다. 수조 원의 투자, 수십만 개의 GPU, 수백 메가와트의 전력. 이번 회부터 전선이 바뀝니다. 같은 AI 칩 전쟁이지만, 무대는 데이터센터가 아니라 당신의 주머니와 책상 위입니다.


추론 전문 일꾼

NPU를 이해하려면, AI의 두 단계를 구분해야 합니다. **훈련(Training)**과 **추론(Inference)**입니다.

훈련은 AI 모델을 만드는 과정입니다. 수십억 개의 파라미터를 수천 개의 GPU로 몇 주에서 몇 달간 학습시킵니다. 전력은 수백 메가와트, 비용은 수천만 달러에서 수억 달러. 데이터센터에서만 가능한 작업입니다.

추론은 이미 완성된 모델을 실행하는 과정입니다. ChatGPT에 질문을 던지면 답이 나오는 것, 카메라가 사람 얼굴을 인식하는 것, 음성 명령을 이해하는 것 — 모두 추론입니다. 훈련에 비하면 연산량이 적고, 전력도 적게 듭니다.

NPU는 이 추론에 특화된 칩입니다. 2회에서 GPU를 "수천 명의 단순 노동자"에 비유했다면, NPU는 "극도로 에너지 효율적인 전문 기술자"입니다. GPU는 수백 와트를 소비하며 대규모 훈련과 추론을 모두 처리하지만, NPU는 몇 와트의 전력으로 추론만을 수행합니다.[7-2]

왜 필요할까요. 세 가지 이유입니다. 첫째, 속도입니다. 클라우드까지 데이터를 보내고 결과를 받는 왕복 시간이 사라집니다. 둘째, 프라이버시입니다. 음성, 얼굴, 문서 같은 민감한 데이터가 기기 밖으로 나가지 않습니다. 셋째, 오프라인입니다. 인터넷이 없어도 AI 기능이 작동합니다. AI를 클라우드에서 손끝으로 가져오는 기술, 그것이 NPU입니다.


TOPS 전쟁의 실상

07회_시각자료_NPU_4사비교.png [이미지: NPU 4사 비교 — 퀄컴, AMD, 인텔, 애플]


CES 2026은 NPU 전쟁의 본격적인 개막이었습니다. 네 회사가 저마다 다른 전략으로 경쟁하고 있습니다.

퀄컴 Snapdragon X2 Elite는 현재 NPU 경쟁의 선두입니다. 6세대 Hexagon NPU로 최대 80~85 TOPS를 달성합니다. ARM 기반 3nm 공정, 18코어 CPU, 전용 64비트 DMA 아키텍처를 갖춘 이 칩은 NVIDIA가 데이터센터를 지배하는 것처럼, 퀄컴이 AI PC 시장을 지배하려는 야심을 담고 있습니다.[7-3] 2026년 4월 첫 노트북이 출시되었으며, 성능 대비 전력 효율에서 인텔·AMD를 40~50% 앞선다는 평가를 받고 있습니다.[7-4] 배터리 수명은 실사용 기준 20시간 이상이 보고되고 있습니다.

AMD Ryzen AI 400 "Gorgon Point"는 x86 진영의 AI 대응입니다. XDNA NPU 60 TOPS, Zen 5 아키텍처, RDNA 3.5 GPU를 결합합니다. x86 소프트웨어 호환성이라는 강점을 유지하면서 AI 기능을 추가한 것이 특징입니다.[7-5] 2026년 중반에는 Zen 6 기반의 "Medusa" 아키텍처가 등장하여, NPU 성능이 더 올라갈 전망입니다.

인텔 Core Ultra Series 3 "Panther Lake"는 인텔의 반격입니다. 자체 Intel 18A(2nm급) 공정으로 제조되는 첫 번째 클라이언트 칩으로, 5세대 NPU가 50 TOPS를 제공합니다. GPU와 합산하면 플랫폼 전체로 170~180 TOPS에 달합니다.[7-6] RibbonFET 트랜지스터와 PowerVia 후면 전력 배선을 채택한 첫 양산 칩이라는 기술적 의의도 있습니다. 2026년 1월 출시 이후 200개 이상의 노트북 디자인에 채택되었습니다.

애플 M4 Neural Engine은 16코어 뉴럴 엔진으로 38 TOPS를 제공합니다. 숫자만 보면 경쟁사에 뒤지지만, 애플의 강점은 다른 곳에 있습니다. 통합 메모리 아키텍처 덕분에 CPU·GPU·NPU가 같은 메모리를 공유하여 데이터 이동에 따른 지연이 거의 없습니다.[7-7] 특히 LLM 추론에서는 원시 TOPS보다 메모리 대역폭이 중요한데, M4 Max의 메모리 대역폭은 다른 Windows 노트북이 따라오기 어려운 수준입니다. 2026년 출시된 M5 세대는 이 장점을 더 강화하고 있습니다.

한 가지 주의할 점이 있습니다. TOPS는 만능 지표가 아닙니다. 같은 TOPS라도 실제 AI 성능은 소프트웨어 최적화, 메모리 대역폭, 지원 모델 형식에 따라 크게 달라집니다. 퀄컴이 80 TOPS이고 애플이 38 TOPS라고 해서, 퀄컴이 애플보다 두 배 빠른 것은 아닙니다.


Copilot+ PC 시대

이 NPU 경쟁에 불을 붙인 것은 마이크로소프트입니다.

마이크로소프트는 2024년 "Copilot+ PC"라는 새로운 PC 범주를 정의하며, 그 기준으로 NPU 40 TOPS 이상을 제시했습니다.[7-8] 이 기준을 충족하는 PC에서만 Copilot+ 기능이 작동합니다. Windows Recall(AI 기반 화면 검색), Live Captions(실시간 자막·번역), Paint의 AI 이미지 생성 등이 대표적입니다.

이 정의가 중요한 이유는, PC 구매 기준을 바꿨기 때문입니다. 과거에는 "CPU 몇 코어, RAM 몇 기가"가 스펙의 핵심이었습니다. 이제 "NPU 몇 TOPS"가 그 자리에 추가되고 있습니다. CES 2026에서 MSI, ASUS, HP, Dell, Lenovo 등 주요 OEM이 일제히 AI PC 라인업을 확대한 것은 이 흐름의 반영입니다.[7-9]

Canalys에 따르면, ARM 기반 PC의 시장 점유율은 2025년 약 13%에서 2026년 말 30%까지 상승할 전망입니다.[7-10] 퀄컴의 Snapdragon X2가 이 전환을 이끌고 있으며, 90% 이상의 Steam 인기 게임이 ARM에서 네이티브 또는 호환 계층을 통해 작동하게 되면서, "ARM 노트북은 호환성이 문제"라는 인식도 빠르게 사라지고 있습니다.


한국의 자리는?

NPU 전쟁에서 한국의 위치는 메모리 전쟁과 사뭇 다릅니다.

메모리(HBM)에서 한국은 세계 1위입니다. 그러나 로직 칩(NPU·GPU) 설계에서는 도전자 위치에 있습니다. 삼성의 Exynos 시리즈는 모바일 AP(Application Processor) 시장에서 꾸준히 NPU를 탑재해 왔지만, 퀄컴·애플과의 경쟁에서 선두를 차지하지는 못하고 있습니다.[7-11]

주목할 만한 움직임은 스타트업에서 나오고 있습니다. 리벨리온(Rebellions)은 데이터센터 추론 전용 칩 ATOM을 개발하고 있는 한국 AI 칩 스타트업으로, KT 등 국내 통신사와의 협력을 통해 엣지 AI 시장을 공략하고 있습니다.[7-12] 사피온(Sapeon)도 AI 가속기를 개발 중입니다. 이들은 아직 글로벌 빅4(퀄컴·AMD·인텔·애플)와 직접 경쟁하는 단계는 아니지만, 한국이 메모리를 넘어 로직 칩 영역으로 확장하려는 시도의 최전선에 있습니다.


손끝의 AI

NPU의 확산은 AI를 클라우드에서 손끝으로 가져오는 전환입니다. 데이터센터의 GPU가 AI의 심장이라면, 디바이스의 NPU는 AI의 신경계입니다. 심장에서 펌프한 혈액(모델)이 신경계(NPU)를 통해 손끝(디바이스)까지 도달하는 구조입니다.

80 TOPS의 NPU가 노트북에 들어가는 시대. 2년 전만 해도 상상하기 어려운 일이었습니다. 이 확산은 또 다른 질문을 던집니다 — AI가 단순히 명령에 응답하는 것을 넘어, 스스로 판단하고 행동하는 "에이전트"가 되려면, 어떤 칩이 필요할까요.


1. 이 글은 『보이지 않는 전쟁 — AI 반도체, 누가 미래를 지배하는가』 연재의 7회입니다. 매주 화·수·금 발행됩니다.

2. 이 글은 필자가 주 2회(월,목) 발행하는 브런치 매거진 'AI 트렌드 리포트'의 기획기사로 12회에 걸쳐 연재할 예정입니다.


참고 자료

FinancialContent, "The 85 TOPS Revolution: Qualcomm's Snapdragon X2 Elite Redefines the AI PC Era at CES 2026", 2026년 2월 5일.

Local AI Master, "NPU Comparison 2026: Intel vs Qualcomm vs AMD vs Apple", 2026년 2월 6일.

Tom's Guide, "Intel Panther Lake vs Snapdragon X2 Elite vs AMD Gorgon Point", 2025년 12월.

BawlBuster, "2026 Laptop Processor Wars", 2026년.


각주

[7-1] FinancialContent, "The 85 TOPS Revolution", 2026년 2월 5일. 퀄컴 Snapdragon X2 Elite Extreme 최대 85 TOPS NPU. CES 2026 키노트 발표.

[7-2] Local AI Master, "NPU Comparison 2026", 2026년 2월 6일. GPU와 NPU의 전력 소비 비교: GPU 수백 와트, NPU 수 와트 수준.

[7-3] FinancialContent, 위 기사. "6th Generation Hexagon NPU achieves up to 85 TOPS, dedicated 64-bit DMA architecture, 228 GB/s memory bandwidth in Extreme models."

[7-4] Tech-Insider, "Snapdragon X2 Elite Review", 2026년 4월 7일. "Qualcomm still maintains a 40-50% lead in performance-per-watt for ultra-portable laptops." NotebookCheck(2026.4.7) 벤치마크 확인.

[7-5] AMD 공식 보도자료, CES 2026, 2026년 1월 5일. "Ryzen AI 400 Series: 60 TOPS NPU, Zen 5, RDNA 3.5." Tom's Hardware CES 라이브블로그 확인.

[7-6] BawlBuster, "2026 Laptop Processor Wars", 2026년. "Intel Core Ultra Series 3: 5th-gen NPU delivers 50 TOPS standalone. Combined with GPU, total platform AI performance reaches 170-180 TOPS."

[7-7] Local AI Master, 위 기사. "Despite lower TOPS, Apple M4 Max excels at LLM inference: memory bandwidth > raw TOPS."

[7-8] Microsoft, Copilot+ PC 공식 발표, 2024년. NPU 40 TOPS 이상 기준. Tech-Insider(2026.4): "Microsoft's Copilot+ PC initiative requires a minimum of 40 TOPS NPU performance."

[7-9] Tom's Guide, "Intel Panther Lake vs Snapdragon X2 Elite vs AMD Gorgon Point", 2025년 12월. CES 2026 OEM 라인업 확대 보도.

[7-10] Tech-Insider, 위 기사. "ARM-based PCs are projected to capture up to 30% of the total PC market by end of 2026, according to Canalys, up from roughly 13% in 2025."

[7-11] 삼성전자 Exynos 공식 페이지. Exynos 2400/2500 NPU 사양. 글로벌 모바일 AP 시장에서 퀄컴·애플에 이은 3위권.

[7-12] 리벨리온 공식 홈페이지. ATOM AI 추론 칩. KT 협력 등 국내 엣지 AI 사업 확장 중.

이전 06화NVIDIA를 이기려는 자들