brunch

You can make anything
by writing

C.S.Lewis

by 호몽 이용호 Nov 14. 2023

챗gpt시대, GPU 확보가 승부수

이용호가 말하는 ‘생활 속의 인공지능’

H100 GPU [사진출처=엔비디아]

챗gpt, 생성형 AI와 관련하여 항상 화두가 되고 있는 것이 있다. GPU가 바로 그것이다. 이 칩은 생성 AI의 핵심이라 할 수 있는 대형언어모델(LLM)의 학습과 운영을 담당하고 있기 때문이다. 오래전부터 그래픽카드용 칩 제조회사의 선두주자인 엔비디아(NVIDIA)가 생성 AI용 GPU H100을 내 놓으면서 이 회사의 주식에 전 세계 투자자의 관심이 몰리게 된 것은 당연지사라 할 수 있다. 더구나 글로벌 LLM 업체인 MS, 구글, 메타, 테슬라, 아마존을 포함한 전 세계 LLM 업체들이 경쟁적으로 대규모 컴퓨팅 시스템을 구축하면서 GPU 칩은 심각한 부족한 현상을 일으키고 있는 실정이다. 이번 칼럼에서는 CPU와 GPU의 차이, GPU의 개발 역사와 활용부문 그리고 미래전망 등에 대해 살펴보고자 한다.

 

우선 CPU(중앙 처리 장치)와 GPU(그래픽 처리 장치)의 기능과 차이점에 대해 살펴보자.


첫 번째, 기능과 아키텍처 부분에서 CPU는 순차적인 실행이 필요한 범용 처리 및 처리 작업을 위해 설계되었다. 일반적으로 복잡한 계산 및 의사 결정에 최적화된 몇 개의 코어가 있다. GPU는 병렬 처리를 처리하는 데 특화되어 그래픽 렌더링과 동시에 수행할 수 있는 연산에 적합하다. 동시 실행을 위해 설계된 수백 또는 수천 개의 더 작은 코어가 포함되어 있다.


두 번째, 성능 및 효율성 측면에서는 높은 수준의 논리와 복잡한 명령이 필요한 작업에 탁월한 CPU는 대부분의 소프트웨어 응용 프로그램을 정확하게 처리할 수 있지만 대규모 병렬 계산에 어려움을 겪을 수 있다. 반면에 GPU는 이미지의 픽셀을 렌더링하거나 기계 학습에서 신경망을 훈련하는 것과 같이 많은 더 작은 병렬 작업으로 분해될 수 있는 작업에 이상적이다. GPU의 아키텍처는 CPU에 비해 이러한 작업을 더 효율적으로 수행할 수 있도록 한다.


세 번째, 사용 및 응용분야에서는 CPU는 범용 적이고 운영 체제, 사용자 인터페이스 및 다양한 애플리케이션을 실행할 수 있다. 복잡한 알고리즘과 제어 구조가 필요한 작업에 적합하다. GPU는 주로 이미지를 렌더링하고 비디오를 처리하는 데 활용된다. 그러나 병렬 처리 기능은 딥 러닝 및 과학 시뮬레이션과 같은 분야에서 차별화된 가치가 발휘되고 있다.


요약하면, CPU는 범용의 순차적 작업을 처리하는 데 강점이 있는 반면, GPU의 아키텍처는 그래픽스 및 데이터 집약적 계산 같은 병렬 처리에 더 적합하다.


이번에는 GPU가 발전해 온 과정에 대해서 알아보자.


1980년대 초는 그래픽 가속기가 탄생 되는 시기였다. 1981년 IBM은 모노크롬 디스플레이 어댑터(MDA)와 컬러 그래픽 어댑터(CGA)를 도입하여 그래픽 하드웨어의 길을 열었다. 1982년에 최초의 3D 그래픽 가속기인 지오메트리 엔진이 스탠포드 대학에서 개발되었다.


1980년대 후반에는 3D 그래픽이 등장했다. 1986년 프린스턴 대학교에서 그래픽 인터페이스 프로세서(GRIP)가 설계되었으며, 이후 3D 그래픽 기술 발전에 매우 중요한 전환점이 되었다. SGI(Silicon Graphics Inc.)는 이 기간 동안 고급 3D 그래픽 워크스테이션을 시장에 내놓았다.


1990년대에 드디어 GPU가 세상에 나오게 되었는데 1995년 엔비디아가 설립되었으며, 1997년 RIVA 128을 처음 선보였다. "GPU"라는 용어는 1999년 지포스 256의 출시와 함께 엔비디아에 의해 대중화되었다. 이는 변환과 가벼운 계산을 모두 처리할 수 있는 세계 최초의 GPU로서 시판되었다.


2000년대 들어서는 확장성 및 프로그래밍 가능성이 돋보이는 시기였다. 2000년대 초반, DirectX와 OpenGL 표준은 그래픽 프로그래밍 발전을 도왔다. 2002년 엔비디아가 CG 프로그래밍 언어를 도입하고 ATI(현재 AMD의 일부)가 라데온 R300을 출시하면서 GPU는 더욱 강력하게 프로그래밍이 가능하게 되었다. 2006년 엔비디아에 의해 CUDA(Compute Unified Device Architecture)가 도입되었는데 이는 개발자들이 범용 컴퓨팅을 위해 GPU를 사용할 수 있게 해주었다.


2010년대는 통합과 광선 추적, 딥 러닝의 시기인데 2011년 AMD의 퓨전 APU에서 보듯이 CPU와 GPU를 하나의 칩으로 통합하는 것이 일반화 되었었다. 2018년 엔비디아의 튜링 아키텍처를 통해 포토리얼리즘 그래픽을 구현하는 기술인 실시간 광선 추적이 가능해졌다. 딥러닝과 인공지능(AI)에서 GPU는 필수가 되었으며, 구글의 TPU(Tensor Processing Unit), 엔비디아의 볼타(Volta) 등 다양한 아키텍처가 AI 워크로드를 위해 설계되었다.


2020년대 들어서서는 지속적으로 혁신과 전문화가 이루어져 전용 광선 추적 코어의 개발, AI 가속화 및 에너지 효율성 등과 같이 GPU 한계 능력을 계속해서 넘어섰다. 특정 산업분야, 애플리케이션, 심지어 클라우드 기반 GPU 서비스에 맞춘 특화된 GPU도 크게 확산 보급되었다. 특히 엔비디아가 2022년 10월, 생성 AI시장에서 메인 칩으로 각광받고 있는 H100 GPU 모듈을 출시했는데 이는 호퍼 아키텍처 기반의 최신 GPU 시스템이었다. 이 GPU는 최대 256개까지 연결해 엑사 스케일 작업을 가속화할 수 있는 것이 특징적이다. 전용 트랜스포머 엔진으로 조 단위 매개변수를 가진 대형언어모델(LLM)을 처리하는 주요 역할을 한다. 참고로 오픈AI의 챗gpt에 개발에 활용된 슈퍼컴퓨터에는 H100보다 성능이 다소 떨어지는 암페어 아키텍처 기반의 A100 모듈 1만개를 적용하였다. 


이와 더불어 엔비디아는 지난 8월초 ‘GH200’이라는 획기적인 AI용 슈퍼 칩의 세부사양을 공개하고 2024년 2분기부터 양산에 들어간다고 예고한 바 있다. GH200은 256개의 NVIDIA Grace Hopper 슈퍼 칩에 걸쳐 144TB의 대용량 공유 메모리 공간을 제공하는 AI용 슈퍼 칩이라고 한다. 동일한 회로 기판에서 NVIDIA Grace CPU와 NVIDIA Hopper GPU를 결합하여 대역폭을 7배 증가시키고 상호 연결 전력 소비를 5배 이상 줄일 수 있다고 한다.


GPU 시장에서는 엔비디아가 대항마 없이 독점적 위치를 확고히 다지고 있는 상황인데 그나마  AMD가 엔비디아를 추적하려고 안간힘을 쏟고 있는 중이다. 특히 엔비디아가 수출하지 못하고 있는 중국 시장을 겨냥한 GPU 개발에 입맛을 다시고 있다는 소식도 들려온다. 한편 GPU와는 별도로 AI용 필수 메모리인 '고대역폭메모리(HBM)‘ 부분에서 우리나라의 SK하이닉스와 삼성전자는 미국의 마이크론과 함께 치열한 경쟁을 하고 있는 실정이다.


GPU는 인공지능 시장뿐만 아니라 데이터 센터, 자율주행차 등 다양한 분야에서 활용되고 있다. 또한 GPU의 발전으로 레이 트레이싱, 메타버스, 심층 신경망, 자연어 처리 등의 기술 구현이 쉽게 이루어지게 되었다. 특히 레이 트레이싱 기술은 광선을 역추적하여 장면과 객체의 조명 환경을 사실적으로 시뮬레이션 하는 그래픽 렌더링 기술인데 이는 연산 집약적인 기술이기 때문에 고성능 GPU가 필수적이다. 이 기술로 반사, 굴절, 그림자, 간접 조명 등의 효과를 실시간으로 렌더링할 수 있어 게임, 애니메이션, 영화 등의 분야에서 현실감 있는 그래픽을 만드는데 사용되고 있다.


GPU 시장은 2021년 42조 원 대비 2030년까지 약 596조 원으로 성장할 것으로 예측되며, GPU 기술은 미래 산업에 혁신적인 영향을 미칠 것이 분명하다. 다만 한 개의 독점적인 회사에만 의존하는 시장 형태에서 탈피하여 경쟁적인 구도로 신속히 자리 잡아야 할 것이다, 그래야 지금처럼 GPU 칩 가격이 30% 가까이 상승해도 구하기 어려운 비정상적인 시장형태가 사라질 것이기 때문이다.


| 작가 프로필


호몽 이용호는 스마트 공장에서 주로 사용되는 ‘머신비전’ 전문회사인 ‘호연지재’를 경영하고 있으면서 다양한 분야에 관심이 많아 메타버스와 유튜브 인플루언서로 활동하고 있다. 특히 ‘머신비전’에서 인공지능 딥러닝에 의한 영상처리기술을 자주 적용하다보니 AI 분야에 대해서도 해박한 지식을 가지고 있다. 또한 SKT 메타버스 플랫폼인 이프랜드(ifland)에서 매주 월요일 오후 9시에 정기적으로 ‘힐링토크쇼 호몽캠프’를 진행하고 있으며 86회 이상 진행된 토크쇼에는 작가, 강사, 가수, 연주가, 아티스트, 사업가 등 여러 분야의 전문가들이 초대되었다. 


주요 강의 분야는 “챗gpt 시대 생활 속의 인공지능 발견하기”, “시니어와 MZ세대 간의 원활한 커뮤니케이션”, “시니어 세대 인플루언서 활동으로 인생 이모작”, “워라밸 시대 워크닉으로 행복한 인생 만들기” 등이 있으며, 저서로는 『나는 시니어 인플루언서다』가 있다. 

작가의 이전글 인공지능을 이용하면 나도 작곡가다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari