brunch

脫폰노이만…지금은 AI 반도체 신기술 춘추전국시대

석민구·신창환·권석준 교수의 '차세대 반도체'

by 생각하는T
엔비디아, GPU 넘어 CPU로 영역 확장
빅테크·일반 기업은 '맞춤형 ASIC' 개발
컴퓨팅 기술, 범용성에서 맞춤형으로 발전

로직-메모리 간 전송 에너지, 연산의 1000배
'폰 노이만 구조' 내재적 비효율 탈피 위해
PIM·로직-메모리 통합 등 새 구조 제시돼

극자외선 넘어선 고속 전자빔 노광
전자 대신 질량 없는 광자 이용 등
차차세대 반도체 후보 기술도 소개


"폰 노이만 컴퓨팅은 혁신의 정점에서 한계에 봉착했다.(석민구 컬럼비아대 전기공학부 교수)"


1945년 미국 벨연구소의 윌리엄 쇼클리가 반도체 현상을 이론화한 이후 80년 동안 반도체 기술은 '무어의 법칙(18~24개월마다 집적도가 두배로 발전)'을 지켜오며 발전했습니다. 그 어느 때라고 기술 혁신이 쉬웠겠습니다만 반도체 업계는 지금은 정말로 어떤 벽에 부딪힌 것 같습니다.


선폭 공정은 수 나노(nm) 단위로 초미세화 되며 반도체의 핵심인 '전류 통제'가 어려워졌습니다. 삼성전자 파운드리 사업부가 세계 최초로 3나노 노드 서비스를 제공하면서 게이트올어라운드(GAA)를 적용하고, TSMC는 핀 개수를 회로 설계자가 자유롭게 정의할 수 있도록 하는 핀플렉스(FINFLEX)를 개발한 것은 이런 이유 때문입니다.


또 인공지능(AI)은 우리 일상에 부쩍 다가왔는데 기존 방식으로 데이터센터를 돌리려면 전력이 많이 듭니다. 연산처리장치와 메모리(D램) 간 데이터 전송에 연산의 100~1000배의 에너지가 소요된다는 점이 주요 요인입니다.


최종현 SK그룹 선대회장을 기념하는 '최종현학술원'이 후원해 석민구 컬럼비아대 전기공학부 교수·신창환 고려대 전기전자공학부 교수·권석준 성균관대 고분자공학부 교수가 쓴 '차세대 반도체'는 현재(2023년 발행)의 반도체 기술의 과제와 이를 해결하기 위한 차세대 기술을 소개합니다.


일단 가볍게 지금의 첨단 반도체 상황을 짚어보겠습니다. AI 반도체는 현재 엔비디아의 GPU가 전 세계 시장의 90%가량을 장악하고 있습니다. 엔비디아의 '그레이스호퍼 슈퍼칩'은 GPU뿐만 아니라 CPU까지 영역을 확대하겠다는 엔비디아의 야심이 담긴 AI 가속기입니다. 엔비디아가 GPU(호퍼)뿐 아니라 CPU(그레이스)를 제작했고, 이를 자사 기술인 엔비링크로 연결했다는 점뿐 아니라, 그레이스 CPU를 인텔 x86 아키텍처가 아닌 Arm의 기반 코어를 사용해 만들었다는 점에서 그렇습니다.


빅테크를 비롯한 대기업들은 엔비디아의 범용 AI반도체인 GPU 생태계에만 의존하지 않고, 각자 자기 회사의 필요에 맞는 맞춤형 반도체(ASIC)를 제작하고 있습니다. 애플도 아이폰이나 맥북에 들어갈 AP, CPU를 자체 설계하고 있고 구글, 메타, 바이트댄스 등은 브로드컴을 통해 맞춤형 AI 반도체를 개발하고 있습니다. 칩을 자체 설계하면 각 기업의 목적에 맞게 설계를 최적화할 수 있고 공급망 관리(SCM, supply chain management)에도 유리하기 때문이죠.


이제 컴퓨팅 세계는 기존의 '폰 노이만 구조'에서 벗어나야 할 상황에 놓였습니다. 헝가리 출신 미국 물리학자·컴퓨터공학자 폰 노이만이 제시한 컴퓨팅 구조는 컴퓨터 하드웨어에 프로그램을 내장한 방식을 일컫습니다. 지금 PC에서 쉽게 볼 수 있듯 미리 저장해 둔 프로그램을 바탕으로 컴퓨터가 작동하는 것이죠. 하드웨어를 변경하지 않고 소프트웨어만 교체하면 여려 기능을 구현할 수 있습니다. 범용성이 크다는 장점이 있습니다.


폰 노이만 구조는 로직과 메모리가 물리적으로 분리돼 있다는 게 특징입니다. 그런데 문제는 로직과 메모리 간 데이터 전송에 너무 많은 에너지와 시간이 투입된다는 점입니다. CPU 내부의 코어(연산기능)와 캐시메모리(저장) 간 데이터 전송만 해도 연산 자체가 소모하는 것보다 10~100배 많은 에너지를 사용한다고 합니다.


칩 자체가 물리적으로 분리돼 있는 CPU/GPU에서 D램간의 데이터 이동시에는 산술논리장치 연산 때의 100~1000배의 에너지가 사용된다고 합니다. 지금의 AI 데이터센터가 전기 소비가 많은 주된 이유입니다.

이 문제를 해결하기 위해 제시된 방안은 큰 틀에서 범용형 반도체(GPU가 대표적)가 아닌 각 목적에 맞는 맞춤형 반도체(ASIC)를 만드는 겁니다.


기술적으로도 다양한 대안들이 개발되고 있습니다. PIM(prossecing in memory)은 그중 하나입니다. 메모리(D램) 안에 로직 회로를 넣어, D램이 로직칩으로부터 독립적으로 연산을 수행할 수 있도록 한 것입니다. 메모리 자체에서 연산을 하기 때문에 로직 칩으로 전송할 데이터 크기를 줄일 수 있고, D램과 로직 칩 사이에 필요한 데이터 전송의 양과 횟수도 줄일 수 있습니다.


그런데 PIM을 구현하는 데는 큰 난관이 있습니다. 워크로드를 연산장치와 메모리가 똑같이 나누기가 어렵다는 점입니다. 석민구 교수는 이에 온전히 GPU/CPU와 D램을 합치는 게 대안이 될 수 있다고 말합니다. 또 성능 개선·전력 소모 감축을 위해 로직과 메모리의 물리적 구분을 없앤 인-메모리 컴퓨팅(IMC), 최대한 온칩 메모리만 사용해서 연산하는 방법 등이 연구되고 있습니다.


반도체 크기를 줄이기 위해서는 3D 패키징이 이뤄지고 있습니다. 인쇄회로기판 위에 인터포저(금속 배선으로 이뤄져 다른 칩들을 연결해 주는 역할)를 올리고 그 위에 로직, 메모리를 올리는 게 2.5D 구조가 쓰이고 있습니다. 궁극적으로는 인쇄회로기판 위에 인터포저 없이 로직을 올리고 그 위에 메모리를 층층이 쌓는 3D 메모리-온-로직도 개발돼 상용화될 전망입니다.


컴퓨팅 세계에서 범용성과 맞춤형·최적화는 늘 이런 방식으로 관계돼 왔습니다. 1968년 인텔 창립 시 당초 비즈니스 모델이 범용성이 큰 D램(메모리) 제작이었지만, 곧 마이크로프로세서(로직) 제작으로 사업 모델을 틀었지요. 지금은 엔비디아의 GPU가 범용성이 크다는 점에서 AI반도체 시장을 장악하고 있지만, 맞춤형 반도체에 그 시장을 상당 부분 내줄지도 모를 일입니다.


여기까지가 '차세대 반도체' 기술이라면 그 이후의 '차차세대 반도체' 후보 기술도 소개됐습니다.

비교적 가까운 미래에 도입될 것으로 보이는 차차세대 기술에는 고속 전자빔 노광장비가 있습니다. 인텔 등 세계 유수 반도체 기업들이 십수 년을 투자해 만든 ASML의 극자외선(UAV) 노광 장비로 인해 수 나노미터 단위 공정이 가능해진지도 이제 몇 년 되지 않았습니다. 그다음으로는 아예 고속 전자빔 노광이나 2차원 반도체 기반의 자리 조립 등이 후보로 거론되고 있다고 합니다.


중장기적으로는 전자 대신 정지 질량이 없고 저항이 통제되는 광자 등 준입자들을 활용한 연산도구가 필요해질 수 있다고 전망합니다. 여기서부터는 엄밀한 의미(도체와 부도체 사이의 물질이라는 뜻의)에서는 더 이상 반도체가 아닌 것이지요. 전자는 작긴 해도 질량이 있고 전하를 지니기 때문에 초미세 규모에서는 신호 손실과 전기 저항의 영향이 커집니다.


그래서 언젠가는 전자가 아닌 준입자를 활용한 컴퓨터가 나올 수도 있다는 전망입니다. 궁극적으로는 '양자 컴퓨터'가 그 수순인데 저로선 아직은 너무 꿈같기만 합니다. 일반인으로서는 반도체 원리도 이해하기 어려운데, 언젠가는 양자역학도 공부해야 할 것 같습니다.


이 책은 이렇게 현재 반도체 기술이 봉착한 난관과 이를 극복하기 위한 차세대 반도체 기술을 소개합니다. 이 책의 최대 장점은 저자들이 세계적 수준의 반도체 석학임에도 일반인들에게 반도체 기술을 이해시키고자 엄청나게 쉽게 쓰려고 노력했다는 점입니다(물론 그래서 꼭 이 책이 쉽게 읽힌다는 뜻은 아닙니다). 가령 전력 효율을 설명하게 위해 TOPS/W를 쓰면서 그냥 넘어가지 않고 "1W(와트) 전력으로 수행할 수 있는 초당 연산 횟수" "TOPS는 Tera-operations per second 약자로 Tera는 10의 12승을 뜻한다"라고 친절한 설명을 덧붙입니다. 그래픽을 다방면으로 활용해 반도체 원리나 세계 반도체 산업 분포 등 이해를 돕는다는 것도 매우 큰 장점입니다.

keyword
작가의 이전글AI 반도체의 미래, 데이터 경량화·저전력화에 달렸다