국산 AI 반도체칩 스타트업의 도전
퓨리오사AI의 정영범 상무에게 직접 들은 회사 소개는 인상적이고 흥미로웠다. 퓨리오사AI는 AI 연산을 위한 고성능 반도체를 설계하는 한국의 팹리스 기업이다. 2017년 창업 당시부터 ‘추론(inference)’에 특화된 구조를 지향했으며, 대규모 ‘학습’보다 실시간 응답과 에이전트 실행에 적합한 아키텍처를 선보이고 있다.
퓨리오사AI가 본격적으로 주목받은 시점은 2025년 4월, 메타의 8억 달러 인수 제안을 거절했을 때였다. 매각 대신 독립적인 기술 비전을 선택한 이 결정은 시장에 강한 인상을 남겼다.
회사 이름은 영화 <매드맥스>의 주인공 ‘퓨리오사’에서 영감을 받았다고 한다. 기득권에 저항해 이상을 지향하는 도전 정신이 기업 철학과 맞았고, 제품명도 ‘워보이’, ‘레니게이드’처럼 같은 세계관을 따른다. 창업자인 백준호 대표는 AMD와 삼성전자에서 반도체 설계를 경험했고, 병가로 쉬던 시기에 AI를 독학하며 창업을 결심했다고 한다.
퓨리오사AI의 차별점은 무엇일까? 정영범 상무는 (1) 설계 방식의 차이가 만들어내는 (2) 에너지 소비 효율성과 (3) 경쟁력 있는 가격을 핵심 요소로 꼽았다.
===
(1) 퓨리오사AI와 엔비디아의 기술적 차이는 입체 퍼즐을 푸는 방식으로 비유할 수 있다. 엔비디아는 퍼즐을 평면으로 펼쳐 조립한 뒤 다시 입체로 되돌리는 방식이고, 퓨리오사는 처음부터 입체 그대로 맞추는 접근을 택했다.
AI 연산에서 핵심은 텐서(Tensor)다. 이는 스칼라(0차원), 벡터(1차원), 행렬(2차원)을 포함하는 다차원 배열로, 이미지·음성·텍스트 등 대부분의 AI 데이터가 이에 해당한다. 엔비디아는 이 텐서를 2차원으로 평면화해 계산한 뒤 복원하지만, 퓨리오사는 원래 형태 그대로 처리한다. 이 접근은 전력과 속도에서 유리하다.
핵심은 ‘텐서 컨트랙션’이라는 연산 방식이다. 이는 고차원 텐서를 특정 축을 따라 곱하고 더해 차원을 줄이는 연산으로, 딥러닝의 핵심 구조다. 퓨리오사의 TCP(Tensor Contraction Processor) 아키텍처는 이 연산을 3차원 이상 그대로 수행하도록 설계되어 있다. 데이터 이동과 재구성 없이 연산이 가능해 효율성과 에너지 소비 모두에서 경쟁력을 가진다.
(2) 설계의 차이로 Renegade 칩은 최대 소비 전력이 150W에 불과하며, 동급 성능을 가진 엔비디아 L40S 대비 60% 이상 전력 효율이 높다.
(3) 가격에서도 차이는 확연하다. Renegade는 동급 성능의 GPU 대비 50% 이하의 가격으로 공급된다. 불필요한 기능을 덜어낸 특화 설계 덕분에 칩 면적도 작고 제조 단가도 낮다.
===
성능 역시 우수하다. 초기 Warboy 칩은 T4 대비 1.5~4배 빠른 속도를 보였고, 일부 벤치마크에서는 A100과 동급의 결과를 냈다. 특히 실시간 추론, 에이전트 실행 같은 워크로드에서는 더 빠르고 안정적인 응답이 가능하다. 성능과 효율의 균형이 잘 잡힌 구조다.
퓨리오사AI는 칩 하나만 만드는 회사가 아니다. ASUS, LG, 플리토, 대만 GUC, TSMC 등과의 협업은 하드웨어 설계부터 공급망까지 전략적으로 얽혀 있다. Hugging Face와 Upstage와는 AI 모델 최적화를 함께 진행하며, 칩과 소프트웨어가 맞물려 발전하는 구조를 지향한다. 기술을 나누지 않고 통합하는 것, 그것이 퓨리오사의 방식이다.
현재 AI 반도체 시장은 엔비디아가 절대적 우위를 점하며, 기업가치는 5,000조 원을 넘긴다. 그러나 퓨리오사가 전체 시장의 10%만 확보하더라도, 이론상 500조 원에 이르는 잠재 가치를 갖는다는 분석도 나온다.
소버린 AI는 이제 선택이 아닌 필수다. 예를 들어 OpenAI가 보유한 약 40만 장의 GPU를 따라잡기 위해, 장당 5,000만 원 수준의 H100급 GPU를 단순 계산만 해도 하드웨어 구매에 20조 원이 소요된다. 여기에 데이터센터 구축, 전력, 유지비, 소프트웨어 최적화까지 포함하면 실제 투자 규모는 훨씬 커진다.
이 현실 속에서 퓨리오사AI는 국산 AI 칩의 가능성을 입증하며, 기술 주권을 향한 중요한 축으로 주목받고 있다.