brunch

AI 반도체의 미래, 데이터 경량화·저전력화에 달렸다

이동수 네이버 박사 등의 'AI 반도체 혁명'

by 생각하는T


5줄로 정리한 딥시크 사태와 AI 반도체의 향방

-최근 딥시크가 주목받은 이유: (딥시크 측 주장의 진위와 상관없이) 저비용으로, 고성능 AI 반도체 쓰지 않고도 AI를 구현할 수 있다는 가능성을 제시했다.

-GPU·챗GPT AI 생태계의 문제점: 고성능 AI 반도체가 아주 많이 필요하고 전력도 많이 소요돼, AI 구현·유지비용이 매우 비싸다.

-챗GPT 등 기존 AI 비용이 비싼 이유: 엄청난 양의 언어 데이터를 무작정 학습을 하는 디코더 기반의 트랜스포머를 활용해야 하고, 추론에도 AI가 한 단어(토큰)를 생성하려면 350GB 파라미터를 모두 훑어봐야 하는 구조다.

-그간의 대안: ARM 기술 기반으로 저전력 반도체 설계, 온디바이스 AI와의 적절한 역할 배분, GPU와 GPU 사이, 노드와 노드 사이 연결 기술 개선, 이용 전력의 절반을 차지하는 냉각 비용 절감(추운 지역에 데이터센터 설치 등) 등 다방면의 노력이 이뤄지고 있다.

-네이버팀의 대안: HBM을 안 쓰는 저전력 AI 반도체를 만들고, 압축·양자화 기술을 고도화해 데이터를 경량화한다.


지난 설 연휴, 'AI 반도체 혁명'을 다 읽어갈 즈음 난데없이 '딥시크 사태'가 터졌습니다. ASML 장비 수출 제한 등 미국의 온갖 반도체 산업 관련 제재를 받고 있는 중국에서 챗GPT와 비견되는 AI 모델을 개발했고 미국 현지에서도 꽤나 인기를 모으고 있다는 소식이었습니다.


이제는 딥시크의 주장을 모두 액면 그대로 받아들일 수 없다는 분위기지만, 딥시크 기술보고서 내용의 진위 여부와 관계없이 이번 사태가 미국 중심의 AI 생태계에 큰 충격을 준 것은 분명한 사실입니다.


'AI 반도체 혁명'은 엔비디아 등 미국 테크기술 중심의 AI 반도체 산업 현황과 미래 방향을 다룹니다. 중국의 AI 반도체 산업에 대해서는 다루지 않지만, 현재의 AI 기술의 도전 과제들이 명시돼 있기 때문에 딥시크가 어떤 면에서 반도체·AI 산업계에 충격을 줬는지는 가늠할 수 있었습니다.


이 책은 네이버클라우드의 이동수 박사(하이퍼스케일 AI 담당이사)가 권순우 삼프로TV 기자를 설득해 만든 'AI 반도체 교양서'입니다. 이 책을 읽고 나면 AI 반도체 관련 기사들을 접하면서 (온전히 이해하진 못하더라도) 대략 어떤 취지인지는 이해할 수 있을 것입니다. 반도체와 AI에 미래 먹거리를 찾고 있는 한국의 시민으로서는 읽을 가치는 충분합니다.

keyword
작가의 이전글美-中 반도체 패권 경쟁을 이해하는 가장 빠른 방법