국내외 AI 반도체 칩 시장과 대표 기업
국내 대표 인공지능(AI) 반도체 기업 퓨리오사AI
퓨리오사AI는 국내 딥테크 기업중에서는 드물게 기업가치 1조 원을 돌파, 유니콘 반열에 오른 회사다.
생성형 AI 시장이 엔비디아 GPU 의존도를 줄일 수 있는 대안을 모색하며
퓨리오사AI는 자사의 2세대 인공지능 반도체 RNGD(이하 레니게이드)를 LG AI연구원의 대규모 언어모델인 EXAONE(엑사원)에
공급을 위한 선정 과정에서 레니게이드가 LG 측의 고성능 조건을 충족시키는 동시에 기존 GPU 대비 2.25배 높은 전력당 성능을 보인 만큼, LG 엑사원 사례는 포춘 글로벌 500대 기업들을 대상으로 유력한 레퍼런스로 작용할 전망이다.
퓨리오사AI는 레니게이드 양산과 3세대 제품 초기 개발에 박차를 가하며
현재 정부의 AI 스타트업 스케일업을 위한 모험자본 확대 기조 역시 매우 고무적이며
한국이 미국, 중국과 함께 AI G3 강국으로 도약하기 위해서는 AI 반도체의 글로벌 경쟁력 확보는 필수이며 최선을 다하고 있는 기업이다.
페타플롭의 전력 효율적인 AI 성능을 제공하는 엔디비아 GB10 슈퍼칩
책상 위에 있는 그레이스 블랙웰 AI 슈퍼컴퓨터(Grace Blackwell AI Supercomputer)로 생성형 AI, 대형언어모델(LLM), 고속 추론 등 다양한 AI 워크플로우를 로컬 환경에서 효율적으로 구현, 설계 가능하다.
데이터 보안 강화와 지연 최소화, 배포 유연성 등을 고려해 로컬 환경에서 직접 AI 모델을 개발, 실행할 수 있는 시스템을 요구하고 데스크톱 환경에서도 데이터 크기나 위치, 모델 규모에 제약 없이 민첩하고 효율적인 AI 개발이 가능하도록 지원한다.
또한, 고성능 엔비디아 커넥트-X(Connect-X) 네트워킹으로 두 대의 엔비디아 DGX 스파크 시스템을 연결해 최대 4,050억 개 파라미터의 AI 모델을 처리할 수 있다.
GB10 슈퍼칩(Superchip)은 엔비디아 그레이스 블랙웰 아키텍처 기반의 시스템 온 칩(system-on-a-chip, SoC)으로, FP4 정밀도에서 최대 1페타플롭의 AI 성능을 제공한다.
참고)FP4란 무엇인가?
FP4는 4비트 부동소수점(Floating Point) 데이터 형식으로, 기존의 FP16이나 FP32보다 훨씬 적은 메모리를 사용하여 숫자를 표현하는 방식입니다.
일반적인 딥러닝 모델에서 가중치(weight)와 활성화(activation) 값을 저장하는 데 필요한 메모리 용량은 모델의 크기에 따라 어마어마해지기 때문에 FP4는 이러한 문제를 효율적으로 해결할 수 있는 대안으로 떠오르고 있습니다.
GB10은 최신 세대 쿠다(CUDA®) 코어와 5세대 텐서 코어(Tensor Core)를 갖춘 엔비디아 블랙웰(Blackwell) GPU를 탑재하고 있다.
NV링크(NVLink®)-C2C 칩-투-칩 인터커넥트를 통해 Arm 아키텍처로 제작된 20개의 전력 효율적인 코어를 포함하는 고성능 엔비디아 그레이스(Grace™) CPU에 연결된다.
Arm 기반 SoC 설계 분야 시장 리더인 미디어텍(MediaTek)이 GB10 설계에 협력해 동급 최고의 전력 효율, 성능, 연결성에 기여했다.
GB10 슈퍼칩을 사용하면 표준 전기 콘센트만으로도 강력한 성능을 구현할 수 있다. 각 프로젝트 디지츠는 128GB의 통합된 일관된 메모리와 최대 4TB의 NVMe 스토리지를 갖추고 있다.
개발자는 이 슈퍼컴퓨터를 통해 최대 2천억 파라미터의 거대 언어 모델(large language model, LLM)을 실행해 AI 혁신을 가속화할 수 있다.
그레이스 블랙웰 아키텍처를 통해 리눅스(Linux) 기반 엔비디아 DGX OS를 실행하는 로컬 프로젝트 디지츠 시스템에서 모델을 프로토타이핑, 미세 조정, 테스트할 수 있다.
엔비디아 DGX 클라우드™(DGX Cloud™), 가속화된 클라우드 인스턴스 또는 데이터센터 인프라에 원활하게 배포가 가능하다.
동일한 그레이스 블랙웰 아키텍처와 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼을 사용해 프로젝트 디지츠에서 AI를 프로토타이핑한 다음 클라우드 또는 데이터센터 인프라에서 확장할 수 있다.
개발자는 엔비디아 네모™(NeMo™) 프레임워크로 모델을 미세 조정하고, 엔비디아 래피즈™(RAPIDS™) 라이브러리로 데이터 사이언스를 가속화하며, 파이토치(PyTorch), 파이썬(Python), 주피터(Jupyter) 노트북과 같은 일반적인 프레임워크를 실행할 수 있다.
사용자는 에이전트 AI 애플리케이션 구축을 위해 엔비디아 블루프린트(Blueprints)와 엔비디아 NIM™ 마이크로서비스를 활용할 수 있다. 이를 활용하면 엔비디아 개발자 프로그램(Developer Program)으로 연구, 개발, 테스트가 가능하다.
출처 : 인공지능 신문 최근 기사/논문 참고