5G, AI 강화한 퀄컴 스냅드래곤 855
사실 지난 해 비슷한 시기에 발표했던 스냅드래곤 845에서 흥미로운 부분이라면 퀄컴이 프로세서를 구성하는 기술들을 유연하게 반영한 점이다. ARM 아키텍처에 기반한 CPU 코어를 설계하던 퀄컴이 독자 코어에 대한 집착을 버리는 대신 ARM 코어텍스 A75와 A55를 변형한 크라이오 385(Kryo 385)를 넣어 코어 설계에 대한 부담을 줄이고 그래픽 프로세서와 신호 처리 부문, 네트워크 등 퀄컴의 강점을 살릴 수 있는 부분에 더 많은 자원을 집중해 기술을 개선했기 때문이다.
이처럼 잘 할 수 있는 부문에 자원을 투입한 결과는 12월 5일 발표한 퀄컴 스냅드래곤 855에도 어렵지 않게 발견할 수 있지만, 그렇다고 지난 해 스냅드래곤 845에서 보여준 기술의 방향성과 결과가 모두 똑같은 것은 아니다. 퀄컴은 모바일 시장이 요구하는 속도를 맞추기 위해 스냅드래곤 845의 개발 방향을 일부 수정했음에도 부분적으로 충족하지 못한 부분이 남은 반면, 스냅드래곤 855는 현재는 물론 앞으로 요구하게 될 요소까지 고려해 설계를 손봤기 때문이다.
그런데 퀄컴 스냅드래곤 855 발표에서 CPU에 대해 좀더 상세하게 소개한 것은 조금 의외다. 대부분은 5G를 포함한 연결성에 관심을 가질 텐데 퀄컴은 ARM 아키텍처에 대한 새 라이센스 이후 CPU의 변경된 부분에 대한 설명을 아껴 온 것을 감안하면 이번에는 이전 발표와 다르게 CPU에 대해 긴 설명을 이어간 것이 특이하다.
7nm 공정으로 양산되는 스냅드래곤 855는 코어텍스 A76과 A55를 기반으로 하는 골드 코어 4개와 실버 코어 4개 등 옥타코어로 이뤄진 크라이오 485 CPU를 싣고 있다. 하지만 퀄컴은 ARM의 설계를 그대로 쓰지 않고 더 나은 성능을 낼 수 있도록 일부를 변경했다. 비순차 실행 결과를 반영하는 커밋 창을 더 키우고 데이터 프리페치를 최적화했다고 밝힌 것이 그렇다. 단지 원래 ARM의 코어텍스 A76에서 제안한 비순차 실행에 따른 커밋 창의 크기는 128인데, 퀄컴은 자체적으로 조정한 크기를 밝히지 않았을 뿐이다.
또한 고성능으로 작동하는 4개의 골드 코어의 구성이 독특하다. 4개의 고성능(골드) 코어 가운데 2.84GHz로 작동하는 프라임 코어 1개와 2.42GHz로 작동하는 퍼포먼스 클럭으로 나뉘어 있다. 코어 구조는 같은데 다른 클럭으로 작동하고 L2 캐시 크기도 프라임 코어는 512KB, 퍼포먼스 코어는 256KB로 다르다. 보통 이렇게 높은 클럭을 가진 코어는 빠르게 처리할 싱글 스레드 작업에 할당하고 대신 나머지 코어를 쉬게 만들어 전력 효율성을 높인다. 하지만 크라이오 485의 프라임 코어는 퍼포먼스 코어와 전압판을 공유하고 있어 프라임 코어나 퍼포먼스 코어가 완전히 따로 작동하는 상황은 아니다. 때문에 단일 작업의 전력 소모를 줄이는 측면보다 동일 전력에서 성능을 높이려는 방향으로 보이는데, 퀄컴은 이러한 변형으로 스냅드래곤 845의 크라이오 385보다 크라이오 485가 45% 더 나아진 성능을 낸다고 발표했다.
스냅드래곤 855의 GPU인 아드레노 640도 이전 세대인 아드레노 630보다 20% 더 성능을 높였다. 아드레노 640은 GPU 코어 수를 늘리지 않는 대신 부동소수점 연산을 위한 연산 유닛(ALU)을 50% 더 늘렸다. 퀄컴은 연산 유닛이나 코어 수를 무작정 늘리는 것보다 아드레노 640으로 할 수 있는 역할을 더 강조한 듯한 인상이다. 이전 아드레노 630도 게이밍과 시각 현실에 필요한 기술을 탑재하면서 기능성을 상당히 부각했는데, 아드레노 640은 HDR 게이밍과 사물이나 빛의 영향을 반영한 물리 기반 렌더링을 강화했다. 여기에 디스플레이 IP를 결합해 초당 120 프레임으로 재생하는 게임을 즐길 수 있고, 8K 해상도의 360도 영상까지 재생할 수 있다. 지난 해부터 늘기 시작한 게이밍 스마트폰과 독립형 VR 헤드셋에서 요구하는 능력을 채운 것이다.
퀄컴은 인공 지능에 대한 답도 내놓았다. 지난 해 공개한 스냅드래곤 845에 인공 지능 처리를 위해 DSP 처리 장치인 헥사곤 685의 구조를 상당히 바꿨지만, 추론 가속을 위한 신경망 코어는 넣지 않았다. 화웨이와 애플 및 구글이 신경망 코어를 넣은 AP 또는 추가적으로 신경망 코어를 탑재해 좀더 빨리 AI 애플리케이션에 대응했던 것에 비해 퀄컴의 대응은 소극적으로 보였을 정도다.
이에 퀄컴은 헥사곤 690에 AI 가속을 위한 기술적인 장치들을 변경하거나 추가했다. 일단 스칼라 파이프 라인에 큰 변화 없이 높은 클럭에 의한 성능 향상을 기대할 수 있게 됐고, 헥사곤 벡터 익스텐션(HVX)라 부르는 벡터 프로세서의 파이프라인의 수를 2배 많은 4개로 늘려 처리 능력을 높였다. 여기에 그 이전 헥사곤 프로세서에 없던 텐서 가속기(New Tensor Xccelerators)를 추가했다. 이 텐서 가속기는 퀄컴이 직접 설계한 신경망 프로세서로 AI를 위한 다차원 연산을 맡는다. 물론 기존 스칼라 유닛과 HVX도 AI 추론을 위한 연산에 쓰이지만, 여기에 텐서 가속기를 추가한 4세대 AI 엔진은 이전 CPU와 GPU, DSP를 묶어 처리할 때보다 3배 더 나은 처리 성능을 갖는다는 게 퀄컴의 설명이다. 물론 퀄컴은 이번에도 화웨이나 애플처럼 초당 이미지 인식 같은 쉬운 예시를 들어 성능을 설명하지는 않았다. 여기에 구글 어시스턴트와 바이두 듀얼OS(DuerOS) 같은 AI 기반 음성 비서의 인식률을 높이는 음성 지원 AI 모듈을 따로 넣은 것도 이채롭다.
이미지 신호를 처리하는 ISP도 활용성 중심으로 성능을 보완했다. 스냅드래곤 855의 스펙트라 385 ISP는 저조도 시진과 4K 영상 캡처, 심도를 포함한 4K HDR 인물 사진, 사물 인식 및 추적, 고효율 이미지 형식인 HEIF 지원으로 다른 초점 거리를 가진 3개의 카메라로 촬영한 이미지 통합, 초당 60프레임의 심도 인식을 처리하면서도 전력 소모를 줄이는 데 초점을 맞췄다. 무엇보다 컴퓨터 비전 관점에서 ISP만 맡겨 처리하는 것이 아니라 CPU와 GPU, DSP와 연동하는 AI 엔진을 활용함으로써 적은 전력으로 빠르게 처리한다. 하지만 이러한 하드웨어를 싣고 기능을 구현해도 제조사에 따라 품질 차이가 날 수밖에 없다는 점에 대해선 참고해야 한다.
AI까지는 그래도 경쟁자를 따라잡는 인상이 강하지만, 적어도 모바일 네트워크를 비롯한 거의 연결성 만큼은 퀄컴의 자존심을 확실히 드러내고 싶었던 듯하다. 스냅드래곤 855는 앞으로 가장 중요한 흐름이 될 것이 뻔한 5G에 대한 채비를 한 프로세서다. 물론 스냅드래곤 855 안에 통합했다면 가장 큰 뉴스가 되었을 테지만, 애석하게도 LTE 때 그랬던 것처럼 일단 5G를 지원하는 X50 모뎀을 연동할 수 있는 길만 열었다. 스냅드래곤 855은 X24 모뎀을 통합한 채 출시하고 퀄컴 X50 모뎀을 별도로 탑재하면 6GHz 이하 5G NR(New Radio)과 24GHz 이상 밀리미터파로 송출되는 5G를 이용할 수 있다.
그런데 한 가지 주의할 점은 스냅드래곤 855를 탑재한 모든 스마트폰에서 5G를 쓸 수 있는 것은 아니라는 점이다. 스냅드래곤 855은 5G 모뎀을 내장한 것이 아니고 덧붙여야 쓸 수 있기 때문에 스냅드래곤 855를 탑재한 스마트폰을 5G 스마트폰이라고 말하기는 어려운 것이다. 또한 퀄컴 역시 스냅드래곤 855와 연동하는 X50 모뎀을 모든 제조사에 공급할 수 있는 여건은 아닌 데다 5G 서비스를 시작하는 각국 이통사에 공급이 충분한 조건을 가진 제조사에 선택적으로 공급할 것으로 보여 한번에 많은 5G 스마트폰을 볼 수는 없을 듯하다.
스냅드래곤 855가 5G를 대비하는 프로세서라고 해도 더 눈여겨볼 대목은 LTE와 무선 랜의 전송 속도를 높인 X24 모뎀이다. LTE 카테고리 20을 충족하는 X24 모뎀은 7개 주파수 대역을 묶고 4개의 안테나로 다중 입출력으로 최대 2Gbps의 다운로드 속도를 낼 수 있다. 물론 LTE 주파수 대역을 그만큼 확보해야 가능하지만, LTE도 5G 초기의 커버리지를 보완하기 위해 전송 성능을 갖춰야 하므로 이에 대비한 측면이 강하다.
여기에 X24 모뎀과 따로 실리는 연결성 코어는두 가지 무선 랜 규격을 모두 얹는다. 먼저 2.4GHz와 5GHz 비면허 대역에서 작동하는 '와이파이6'(Wi-Fi 6)라고 불리는 802.11ax다. 802.11ax는 최대 10Gbps 전송 속도를 낼 수 있다. 직교 주파수 분할 다중 접속(OFDMA)로 대기 시간 감소 및 전송 성능을 끌어올리고, 1024 QAM(직교진폭변조)로 8개의 공간 데이터 스트림으로 늘려 최대 대역폭으로 전송한다. 특히 전송 속도를 높인 것 뿐만 아니라 이용자가 밀집한 공간에서 수많은 이용자에게 안정적으로 데이터를 전송할 수 있도록 효율성을 강화한 것이어서 지하철이나 공연장 등 공공 무선 랜의 성능을 끌어올릴 것으로 기대를 모으고 있다.
와이기그로 불리는 802.11ad를 개선한 802.11ay 초안도 반영했다. 와이기그는 장치와 장치를 무선으로 연결하는 무선 연결 기술로 802.11ay는 60GHz 대역 주파수에서 4개의 채널을 묶어 초당 20~40기가비트를 전송할 수 있는 전송 속도를 갖고 있다. 현재 이 기술에 대한 실무 작업 중으로 아직 표준을 정식으로 인정한 것은 아니지만, 초안 2.1까지 발표되었고, 곧 초안 3.0을 공개한 뒤 회원사의 동의를 받으면 2020년 표준을 완성할 예정이다. 현재 이 기술을 이용해 가상 현실 헤드셋과 PC를 무선으로 연결하는 기술은 이미 나와 있지만, 앞으로 더 많은 장치들이 마치 유선으로 연결된 것처럼 쓰일 수도 있다.
이처럼 퀄컴은 블루투스를 제외하고 5G와 LTE, 그리고 무선 네트워크의 전송 성능을 모두 기가비트 이상으로 구축하면서 최초의 멀티 기가비트 플랫폼이라고 주장하고 나섰다. 스냅드래곤 855에 5G 모뎀까지 통합하지 않은 것에 약간 이견이 있을 수는 있지만, 퀄컴이 이처럼 네트워크의 기술력을 앞세울 수 있는 기회를 맞이한 것 자체가 얼마나 오래 된 일인지 모르겠다.
아마도 그런 기회를 퀄컴도 쉽게 날릴 지 않으려 애썼을 듯하다. 스냅드래곤 855에서 연결성만 아니라 인공 지능을 비롯한 이미지와 시각 현실 작업에 필요한 강력하고 효율적인 구조의 플랫폼으로 만든 것은 그만큼 높아진 이용자의 요구를 반영하고 있다는 의미다. 물론 아직 스냅드래곤 855를 탑재한 제품이 출하 전이므로 어떤 판단도 섣부를 것이다. 출시 이후에도 의도한 만큼 성능이 나오지 않을 수도 있고, 예측 불가능한 문제도 있을 수 있으니까. 그래도 퀄컴 스냅드래곤 855에 조금이나마 기대를 하는 것은 시대가 필요로 하는 것을 채운 노력 때문은 아닐까?