brunch

You can make anything
by writing

C.S.Lewis

by Grandmer Sep 01. 2024

AI 반도체 혁명

3차 반도체 전쟁, 최후의 승자는 누가 될 것인가


[ 글을 시작하기 전에 ]


2024년 6월 대만에서 열린 IT 전시회 컴퓨텍스 2024에 전 세계 반도체 IT 기업 CEO들이 모여 각자가 만든 AI 반도체 최신 제품을 공개했다. 


컴퓨텍스는 1981년 대만에서 열리기 시작한 PC 관련 전시회인데, 이번처럼 전 세계의 언론의 주목을 받은 적이 없었다. 


갑자기 전 세계 미디어의 관심이 컴퓨텍스로 향한 것은 어느 대만 사람들 때문이다. 


전 세계 1위 AI반도체 회사 엔비디아 CEO인 제는 황이 대만 출신이고, 격차가 크긴 하지만 사실상 2위 회사로 평가할 수 있는 AMD의 CEO 리사 수도 대만 출신이다. 


이들이 설계하는 AI반도체를 손에 잡히는 실물로 만드는 위탁 생산은 대만 회사인 TSMC가 한다. 


대만에서 열린 컴퓨텍스에 이들이 모두 모였고 그 존재만으로 전 세계 미디어의 주목을 이끌어낸 것이다. 


지금까지 반도체 CEO들이 이렇게 주목을 받은 적은 없었다.


그런데 인공지능이 가시화되고 더 많은 사용성을 보여줌으로써 이들의 행보에 우리의 미래가 예측할 수 있다는 생각에 반도체 기업 CEO들이 더 주목을 받게 되는 것이다. 


그럼 이들이 만들어갈 미래는 무엇인지 어떻게 발전되고 있는지 다른 기업은 어떤 형태로 경쟁하고 있는지 알아볼 수 있도록 하자. 


Ⅰ. 반도체 전쟁의 서막


최첨단 반도체를 비싸게, 대량으로 구매할 수 있는 고객은 전 세계에서 손에 꼽는다. 


중국을 제외하면 애플, 퀄컴, 엔비디아, 인텔, AMD, 삼성전자, 미디어텍, 테슬라 정도다. 


TSMC가 반도체 파운드리 분야에서 압도적 1위를 지켜가고 있는 가장 중요한 요소 중 하나는 고객, 바로 애플이다. 


애플은 최신 모바일폰을 내놓을 때 가장 성능 좋은 반도체를 탑재할 필요가 있다. 


애플이 설계한 반도체는 TSMC에서 만들어지며, 해당 반도체가 탑재된 아이폰은 전 세계에서 비싸게 팔린다. 


TSMC가 막대한 선단 공정 투자를 해도 애플이 생산을 맡겨줄 것이기 때문에 과감한 투자가 가능하다. 


또 애플 반도체를 만들며 쌓인 노하우를 바탕으로 그보다 낮은 공정은 훨씬 저렴하게 생산할 수 있다. 


퀄컴, 엔비디아, AMD 등 전 세계 반도체 산업을 주도하는 설계 회사들은 최고 성능의 반도체를 원한다. 


한번 삐끗하면 점유율을 송두리째 뺏길 수도 있기 때문이다. 


이들은 자신들이 설계한 최고의 반도체가 가장 잘 제조될 수 있는 최고의 파운드리를 원한다. 


그러다 보니 고객들이 TSMC에 몰린다. 


쉽지 않은 파운드리 시장에 자기 반도체도 제대로 만들지 못하던 인텔이 뛰어들면 과연 누가 과감하게 대규모 물량을 만들어줄 것인가. 


인텔이 야심 차게 추진하고 있는 인텔 파운드리 서비스의 첫 고객은 MS다. 


MS는 1.8 나노 인텔 파운드리 서비스에서 자신들이 설계한 반도체를 생산할 예정이다. 


어떤 반도체를 만들 것인지를 구체적으로 밝히진 않았지만 마이아 100의 후속작을 발주했을 것으로 추정된다. 


사티아 나델라 CEO는 생산성을 근본적으로 변혁하기 때문에 신뢰할 만한 최첨단 고성능 고품질 반도체 공급망이 필요하다며 MS가 인텔 18A 공정을 택한 이유라고 설명했다. 



Ⅱ. 데이터센터 1위 아마존, 어제의 친구가 오늘의 적


 AI 초거대언어모델은 말 그대로 매우 거대하기 때문에 데이터센터에서만 구동된다. 대부분 사업자들은 자체적인 데이터 센터를 구축하기 힘들기 때문에 클라우드 데이터 서비스를 제공하는 업체를 이용한다. 


AWS는 글로벌 클라우드 서비스 시장의 30% 이상을 점유하고 있는 글로벌 1위 업체로 2위 MS의 점유율보다 10% p 이상 높다. 


3위 구글은 10% 초반대다. 가장 큰 데이터센터를 운영한다는 것은 그만큼 반도체도 많이 산다는 의미다. 


CPU, GPU, 메모리 모두 많이 사야 한다. 많은 사람들이 AI 서비스를 운영할 데이터 센터를 원하고 있고 AWS는 엔디비아로부터 막대한 규모의 GPU를 사고 있다. 


돈 주는 쪽이 갑이긴 하지만 엔디비아는 을치고는 꽤나 부담스러운 을이다. 


AWS의 갑은 데이터센터를 이용하는 고객들이다. 그리고 그 고객들은 엔비디아 GPU를 사용하고 싶어 한다. 


AWS가 엔비디아 GPU를 확보하지 못하면 고객들은 다른 클라우드 서비스 업체로 옮겨갈 것이다. 


고객들이 원하는 충분한 규모의 GPU를 확보해야만 AWS는 사업을 영위할 수 있는 것이다. 


그런데 엔비디아 GPU는 가격이 매우 비싼 데다 사고자 하는 사람들이 많아서 사고 싶다고 충분히 많이 살 수 있는 것도 아니다. 


을이긴 하지만 부담스러운 을이다. 


Ⅲ. 온디바이스 AI


우리가 추구하는 AI의 모습은 인공지능 비서다. 


유능한 인간 비서는 내가 길게 말하지 않아도 내가 원하는 것을 알아서 준비해 준다. 


내 상태를 보며 내 기분을 파악하고 그에 맞춰 음식, 장소 등을 골라줄 수 있다. 


유능한 비서가 내 마음을 잘 파악할 수 있는 이유는 나를 옆에서 관찰하고 함께 생활하며 나에 대한 정보를 많이 갖고 있기 때문이다. 


그래서 행여나 그 비서가 나를 배신하면 큰 사고로 이어질 수 있다. 고위 기업인, 정치인들의 스캔들이 터질 때 중요한 폭로자로 운전기사나 비서가 등장할 때가 있다. 


가장 신뢰할 수 있는 사람이 가장 가까이서 나를 보필해 줄 때 가장 편하지만 그 사람이 나를 배신할 때 입을 타격도 가장 크다. 


인공지능도 마찬가지다. 아무리 뛰어난 인공지능이더라도 나에 대한 정보가 입력되지 않으면 나에게 최적화된 서비스를 제공할 수 없다. 


하지만 인공지능이 나의 정보를 나를 위해서만 사용할 것이라고 100% 신뢰하기는 힘들다. 


내 손안에 있는 기기에 저장이 되는 것도 찝찝한데 데이터 센터에 저장이 되는 상황이 달가운 사람은 없다. 


Ⅳ. 모바일 시대의 절대 강자, 애플 신화의 시작


모바일 반도체 시대에 반도체 업체들은 수익 계열화로 영역을 공고히 했다. 한 분야의 장악력은 다른 분야에 진출하는 강력한 무기가 됐고 영역이 넓어질수록 영향력은 더욱 커졌다. 


애플이 아이폰을 출시하자마자 삼성은 부족하지만 옴니아를 출시해 빠르게 추격했고 갤럭시 시리즈를 출시하며 세계 1위 모바일폰 회사로 발돋움했다. 


스마트폰에 들어가는 모바일 AP와 메모리 반도체 위탁생산 역량도 갖췄다. 


카메라 기능을 하는 이미지 센서, 스마트폰에서 가장 넓은 부분을 차지하는 디스플레이, 부품부터 세트까지를 수직 계열화한 유일한 기업이기도 하다. 


애플 역시 첫 아이폰을 출시했을 때 삼성전자의 모바일 AP를 탑재했다. 


당시 아이폰 개발을 맡은 애플의 터프맨은 시제품 완성에 보통 몇 달은 걸리는데 그들은 단 6주 만에 완성했다고 놀라워했다. 


애플은 2010년부터 삼성전자가 설계한 모바일 AP가 아니라 스스로 설계한 A4를 탑재했다. 


A4는 ARM의 기반으로 애플이 설계했고 제조만 삼성전자가 했다. 


초기에는 협력 관계였지만 애플은 2011년 특허 소송을 제기했다. 이후 7년간 특허 전쟁을 벌였고 애플은 삼성전자가 설계한 반도체를 사용하지 않게 되었다. 


자체 제작한 칩도 삼성이 아닌 TSMC에 맡기게 되었다. 애플은 TSMC 전체 매출의 25%를 차지하는 가장 큰 고객이 됐다. 


TSMC가 가장 많은 투자가 필요한 선단 공정을 만들면 가장 먼저 주문하는 고객은 애플이다. 


애플은 모바일을 넘어 데스크톱에서도 인텔 CPU를 밀어내는 탈인텔을 선언했다. 


전력 효율성은 ARM 반도체가 좋지만 성능 면에서는 아직 x86 인텔 CPU에 못 미쳤기 때문이다. 


2020년 애플은 ARM 기반으로 직접 설계한 반도체 M1을 공개했다. 그러면서 M1을 노트북 맥북에어, 맥북 프로, 소형 데스크톱에 탑재하겠다고 밝혔다. 


아이폰을 필두로 모바일 시대를 열었던 애플은 14년 만에 PC에서도 인텔에게 빼앗긴 두뇌를 다시 차지하게 된 것이다. 


반도체 시장은 매우 강력한 과점 시장이면서 전문화된 영역별 파트너십이 중요하다. 


최고의 설계 기술 기업과 제조 기업이 파트너십을 가져야 한다. 


이들은 서로의 목을 겨누면서 손잡고 수직 계열화를 하면서 각 영역별 사업을 주고받는다. 


생태계가 구축되면 영원히 무너지지 않을 것 같은 공고한 성채가 구성된다. 


하지만 패러마임 전환의 시기아 오면 그동안 수면 아래에 존재했던 수많은 기술들이 새로운 파도를 타고 수면 아래에 존재했던 수많은 기술들이 새로운 파도를 타고 수면 위로 올라온다. 


마치 지구를 영원히 지배할 것만 같았던 거대한 공룡이 기후 변화에 따라 멸종하고 새로운 기후에 잘 적응한 인간이 지구를 지배한 것 같은 그런 시장이 바로 반도체 시장이다. 


Ⅴ. 반도체 성능을 좌우하는 냉각 기능


AI 반도체가 전력을 많이 사용한다는 이야기는 자주 나온다. 


데이터 센터가 전기를 많이 쓰니 전력 설비를 더 깔아야 한다는 주장과 함께 전력 관련 회사들의 주가도 치솟기도 했다. 


도대체 전기를 얼마나 많이 사용하길래 그럴까? 그래서 AI 반도체는 전력 효율성이 높아야 한다. 


전기 요금을 낮추기 위해서도 그렇고 냉각에 필요한 설비투자 문제를 줄이기 위해서도 그렇다. 


AI 반도체를 엄청난 성능을 내야 하고 그만큼 전력 사용량이 많다 


국제 에너지 기구에 따르면 2022년 전 세계 데이터센터의 전력 소비량은 약 460 테라와트시다. 이는 전 세계 전력 소비량의 2% 수준이다. 


2026년에는 데이터센터의 전력 소비량이 1000 테라와트시까지 증가할 전망이다. 


한국 전체가 연간 소비하는 전력량이 571 테라와트시다. 한국은 제조업이 발달해서 국가 규모에 비해 전력 소비량이 많다. 


그런데 데이터센터에서 사용하는 전력 사용량이 한국 전체 전력 소비량과 비슷하다는 뜻이다. 


AI서비스가 보편적으로 제공되려면 초거대 언어 모델을 처리하는 데이터 센터가 확충돼야 하고 그만큼 에너지 사용량은 늘어날 수밖에 없다. 


전체 전력 생산에서 재생 에너지가 차지하는 비중이 높지 않은 상황에서 전력 사용량 증가는 탄소 배출 증가로 이어지고 지구 온난화는 더욱 심해질 수밖에 없다. 


그렇다고 성능이 떨어지는 반도체를 쓸 수도 없다. 


결국 성능은 뛰어나면서 전력은 덜 쓰는, 전력 효율성이 높은 AI반도체를 개발해야 한다. 


Ⅵ. 냉각도 문제다. 


전력 사용량이 많아지면 그에 비례해 반도체 자체에서 열이 많이 난다. 


최근 발표되는 AI 반도체의 전력 사용량은 1000와트에 달한다. 전기난로의 전력 사용량이 1000와트 정도다.

 

반도체 하나하나가 전기난로만큼 전력을 사용하고 그만큼 열을 발생시킨다는 것이다. 


데이터센터에는 엄청나게 많은 반도체가 들어간다. 전기난로로 가득한 창고를 생각해 보라. 


이 전기난로들을 냉각시키려면 또다시 엄청난 전력이 필요할 것이다. 


반도체는 적정 온도를 넘어서면 열을 발생하여 전류를 생성하게 생성된 전류는 다시 열을 식히는 피드백으로 나타난다. 


결국 이 과정에서 발생하면 순식간에 반도체가 타버리기 때문에 적절한 온도를 항시 유지하기 위한 냉각 장치가 필요하다.


믿기 어렵겠지만 데이터 센터에서 소비되는 전력 중 절반은 서버를 운영하는 데 쓰고, 나머지 절반은 서버를 운영하며 나오는 열을 식히는 데 사용된다. 


냉각은 반도체를 설계할 때부터 고려해야 할 매우 중요한 요소다. 


전력 효율이 좋으면 전기요금도 아낄 수 있고 냉각을 위한 전력 부담도 덜 수 있다. 


반도체에는 성능을 극대화할 수 있는 온도가 따로 있다. 


그래서 데이터 센터는 항상 낮은 온도를 유지해야 하기에 한겨울에도 에어컨을 튼다. 


메타의 데이터센터는 스웨덴 롤레오 지역에 위치해 있다. 룰레오의 평균 기온은 0도 이하이고, 한 여름에도 25도를 넘지 않는다. 


냉각 비용을 낮추기 위해 애초에 기온이 낮은 북극에 데이터 센터를 만든 것이다. 


MS는 2015년부터 데이터센터를 잠수함 모양으로 만들어 바다에 넣는 나틱 프로젝트를 진행했다. 


온도가 낮은 심해에 데이터 센터를 지어 냉각 부담을 덜어보려는 시도였다. 


서버업체 페어네트웍스는 라스베이거스 사막 한가운데 데이터센터를 건설했다. 


라스베이거스 사막의 날씨는 덥지만 일조량이 많다. 페어네트웍스는 데이터센터 외곽 전체를 태양광 패널로 덮어 이를 통해 생산한 전력을 냉각 부담을 덜고 있다. 


[ 글을 마치며 ]


AI 기술이 우리 삶에 들어오기 시작하면서 실질적으로 AI가 사용가능하다는 생각을 모두가 하게 된 듯하다. 

그런데 이미 AI는 대기업에서 상용화되었지만 가격이 비싸서 개인화가 진행되지는 못했던 것이라고 생각한다. 


그럼 이 과정에서 우리는 AI를 만들어가는 반도체의 어떤 요소에 집중해야 하는지 알아보도록 하자. 


첫 번째는 인공지능 반도체의 고성능화를 위한 제조 능력의 개선이다. 


반도체는 설계가 제조보다 더 중요하다는 인식이 과거 오랫동안 유지되어 왔었다. 


더 좁은 선폭으로 반도체를 만들기 위해서는 너무 많은 투자금이 필요했고 이런 투자가 필요할 만큼의 대량 생산이나 높은 가격의 반도체 칩을 사려는 수요가 부족했었다. 


그리고 제조 역량의 부족한 부분은 설계로 극복할 수 있는 방법들이 속속 나오면서 미국과 유럽에서는 설계 역량에 좀 더 집중을 했다. 


반면 반도체 제조는 한국과 대만 중국에 집중되는 형태로 반도체 가치 사슬이 분리되는 형태였다. 


그런데 설계 역량이 한국과 대만 중국도 발전함에 따라서 제조 역량이 오히려 반도체 가치 사슬에서 더 중요해지게 되는 형국이 나타나게 되었다. 


대표적인 기업이 TSMC로 애플과 엔비디아 AMD 퀄컴 등 팹리스 기업들은 앞다투어 TSMC의 제조 공정을 선호하게 되었고 TSMC는 초미세 공정에서도 공급이 수요를 따라 잡지 못하는 과정이 반복되게 되었다. 


앞으로는 이런 형국이 더 심화될 것이며 어떤 기업이 그리고 그 기업의 국적이 어떤 나라인가에 따라서 반도체 가치 사슬이 심화되게 될 것이다. 


그런 점에서 앞으로 우리가 주목해야 할 것은 어떤 기업이 반도체 초미세공정을 더 빨리 완성할 것인가에 대해서 지속해서 관심을 가져야 한다. 


두 번째는 온 디바이스 AI가 언제쯤 다수에게 사용될 것인가 하는 것이다. 


AI를 사용할 수 있는 방법으로 크게 클라우드 AI와 온 디바이스 AI로 나누게 된다. 


클라우드 AI는 사용자가 생성형 AI를 사용할 때마다 반복해서 데이터 센터에 접속하는 형태이다. 


이 과정에서 AI는 검색을 위해서 데이터 센터에 접속하고 응답하는 과정을 반복해야 하고 많은 양의 전력을 소비하게 된다. 


반면에 온 디바이스 AI는 데이터 센터까지 정보를 보내거나 응답해야 할 필요가 없고 개개인이 소지한 디바이스 내에서 인공지능의 검색과 활용이 가능하다. 


이 과정에서 온 디바이스 AI는 다수가 사용하기에 효용성이 높은 가격으로 포지셔닝하게 될 것이다. 


그렇지만 온 디바이스 AI를 활용하기 위해서는 새로운 형태의 반도체 칩이 필요하다. 


그리고 현재 사용하는 스마트폰이 모두 변경되어야 하는 조건도 포함되게 된다. 


그렇지만 개인 정보 보호의 중요성과 사용 비용에 대한 효용성을 생각해 본다면 온 디바이스 AI는 분명 스마트폰과 동일한 수준의 혁신이라고 생각이 된다. 


이 측면에서 볼 때 인공지능 반도체의 성능과 반도체 제조 역량이 언제부터 충분해지게 될 것이고 가시화 될 것인지 알 필요가 있다. 


TSMC 삼성전자 인텔 이 세 개 기업의 반도체 제조 공정 로드맵에 따르면 빠르면 2025년부터 2 나노 생산이 가시화될 것이라고 하는데 누가 먼저 스타트를 끊을 것인지 혹은 누가 가장 높은 수율을 만들어내게 될 것인지 지속해서 관심을 가져 볼 수 있도록 하자. 


세 번째는 저전력 반도체가 가지고 올 새로운 흐름이다. 


반도체 생태계를 바꾸어 놓을 요소 중에 하나가 저전력 반도체의 개발이다. 


반도체가 사용하는 전력량에 따라서 디바이스의 수명이 좌지우지되게 된다. 


예를 들어 반도체 전력 소모량이 높을수록 휴대폰의 사용시간이 줄어들 수 있게 되고 혹은 노트 PC를 좀 더 자주 충전해야 하는 상황이 발생되게 될 수 있다. 


지금은 아직 온 디바이스가 확산이 된 상황이 아니기 때문에 이런 걱정을 할 필요는 없지만 데이터 센터를 기준으로 놓고 보았을 때에 사용하는 전력량이 많아 반도체가 사용하는 전력량에 대한 관심도도 증가하고 있다. 


현재는 저전력 반도체가 나오기 전까지 냉각 시스템을 발전시키는 형태로 극복하고 있는데 이는 반도체의 성능에 집중하고 있기 때문이라고 풀이된다. 


최근 엔비디아는 냉각 시스템도 고려한 데이터 센터 반도체에 대한 라인업도 출시하고 있는 것을 볼 때에 성능과 함께 전력 소모량도 중요한 Factor가 될 것으로 보인다. 


특히 온 디바이스 시대에 저전력 반도체는 초미세 공정과 함께 새로운 기술 혁신으로 분류될 것이라고 생각이 든다. 


결국 AI 반도체 혁명의 과정을 따라가다 보면 미래에는 지금 사용하지 않는 새로운 형태의 반도체가 만들어져야 한다는 것을 알 수 있다. 


그리고 그 AI 반도체는 전력 소모량도 적고 더 좁은 선폭을 가지고 있고 전력 공급 형태도 다를 수 있다. 


나아가 반도체 성능은 엄청난 속도로 발전될 수도 있다는 것을 잊지 말도록 하자. 


이 외에도 반도체와 인공지능 발전에 대해서 다양한 내용을 담고 있다. 좀 더 여러 번 읽어 볼 필요가 있을 것 같다.


참고 도서 : AI 반도체 혁명 ( 권순우 이동수 권세중 유지원 )



                     

작가의 이전글 The Money Book
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari