brunch

You can make anything
by writing

C.S.Lewis

by 서진호 Nov 30. 2020

맥에서 텐서플로우 성능 가속화

텐서플로우 블로그

텐서플로우(TensorFlow) 2를 사용하면 다양한 플랫폼, 기기 및 하드웨어에 대한 동급 최고의 훈련 성능을 통해 개발자, 엔지니어, 연구원이 선호하는 플랫폼에서 작업 할 수 있습니다. 인텔 기반 맥(Mac)에서 텐서플로우 사용자들 또는 애플의 새로운 M1 칩으로 구동되는 맥 사용자들은 이제 애플의 맥 최적화 버전인 텐서플로우 2.4 와 새로운 ML Compute 프레임워크를 사용하여 훈련을 가속화할 수 있습니다.  이러한 개선 사항은 텐서플로우 라이트(TensorFlow Lite)를 통해 iOS에서 텐서플로우를 실행할 수 있는 애플(Apple) 개발자의 능력과 결합되어 애플(Apple) 하드웨어에서 고성능 ML 실행을 지원하는 데 있어 텐서플로우의 넓이와 깊이를 계속해서 보여줍니다.


ML 컴퓨팅을 사용하는 맥에서의 성능

맥은 오랫동안 개발자, 엔지니어 및 연구자들에게 인기있는 플랫폼이었습니다. 지난주 애플의 발표와 함께 새로운 M1 칩이 포함된 맥의 업데이트된 라인업을 특징으로하는 애플의 맥에 최적화된 텐서플로우 2.4 버전은 성능이 크게 향상되면서 맥의 모든 기능을 활용합니다.


맥에서 바로 텐서플로우 모델 학습을 지원하는 애플의 새로운 프레임워크인 ML 컴퓨트를 통해 이제 M1 및 인텔(Intel) 기반 맥 등 모두에서 가속화된 CPU 및 GPU 학습을 활용할 수 있습니다.


예를 들어, M1 칩에는 Mac에서 바로 ML 훈련 작업에 최적화된 강력한 새로운 8 코어 CPU와 최대 8 코어 GPU가 포함되어 있습니다. 아래 그래프에서 Mac에 최적화된 텐서플로우 2.4가 인기 모델을 사용하는 M1 및 Intel 기반 맥에서 엄청난 성능 향상을 제공하는 방법을 확인할 수 있습니다.



[그림 1]

[그림1 설명] M1 및 인텔 기반 13 인치 맥북 프로에서 ML 컴퓨트를 사용하는 일반 모델에 대한 훈련 영향은 배치당 초 단위로 표시되며 숫자가 낮을수록 훈련 시간이 더 빠름을 나타냅니다.



[그림 2]

[그림2 설명] Intel 기반 2019 맥 프로에서 ML Compute를 사용하는 일반적인 모델에 대한 훈련 영향은 배치 당 초 단위로 표시되며 숫자가 낮을수록 훈련 시간이 더 빠름을 나타냅니다.


맥에 최적화된 텐서플로우 시작하기

사용자는 ML Compute를 텐서플로우 및 텐서플로우 애드온즈의 백엔드로 사용하기 위해 기존 텐서플로우 스크립트를 변경할 필요가 없습니다.


이것을 시작하려면 애플의 깃허브(GitHub) 저장소를 방문하여 맥에 최적화된 텐서플로우 2.4 포크를 다운로드하고 설치하는 방법을 확인하세요.


가까운 장래에 우리는 분기된 버전을 텐서플로우 마스터 브랜치(master branch)에 통합하여 사용자가 이러한 성능 수치를 보다 쉽게 얻을 수 있도록 이와 같은 업데이트를 만들 것 입니다.


애플의 머신러닝(Machine Learning) 웹 사이트에서 ML Compute 프레임워크에 대해 자세히 알아볼 수 있습니다.


각주들:


1. 테스트는 2020년 10월과 11월에 애플에서 애플 M1 칩, 16GB RAM, 256GB SSD가 장착된 시제품 13 인치 MacBook Pro 시스템과 프로덕션 1.7GHz 쿼드 코어 Intel Core i7 기반 13 인치 맥북(MacBook)을 사용해 진행했습니다. Intel Iris Plus Graphics 645, 16GB RAM 및 2TB SSD가 탑재된 맥프로 시스템. macOS Big Sur 시험판(prerelease), 텐서플로우 2.3, TensorFlow 2.4 시험판(prelease), 미세 조정(Fine-tuning) 기능이 있는 ResNet50V2, CycleGAN, Style Transfer, MobileNetV3 및 DenseNet121로 테스트 되었습니다. 성능 테스트는 특정 컴퓨터 시스템을 사용하여 수행되었으며 MacBook Pro의 대략적인 성능을 반영합니다.


2. 테스트는 2020년 10월과 11월에 애플에서 32GB RAM이 장착된 3.2GHz 16 코어 Intel Xeon W 기반 Mac Pro 시스템, 64GB HBM2가 장착된 AMD Radeon Pro Vega II Duo 그래픽 및 256GB SSD를 사용하여 진행되었습니다. macOS Big Sur 시험판, TensorFlow 2.3, 시험판 TensorFlow 2.4, 미세 조정 기능이 있는 ResNet50V2, CycleGAN, Style Transfer, MobileNetV3 및 DenseNet121로 테스트 되었습니다. 성능 테스트는 특정 컴퓨터 시스템을 사용하여 수행되었으며 Mac Pro의 대략적인 성능을 반영합니다.


원본 제목: 맥에서 텐서플로우 성능 가속화(Accelerating TensorFlow Performance on Mac)
게시자 : Pankaj Kanwar 및 Fred Alcober
원본 링크: https://blog.tensorflow.org/2020/11/accelerating-tensorflow-performance-on-mac.html
TensorFlow 2.4 for MacOS Github: https://github.com/apple/tensorflow_macos
TensorFlow Lite : https://www.tensorflow.org/lite
Apple's Event Announcement : https://www.apple.com/apple-events/november-2020/?useASL=true
TensorFlow Master Branch: https://github.com/tensorflow/tensorflow#community-supported-builds
Apple's Machine Learning WebSite: https://machinelearning.apple.com/updates/ml-compute-training-on-mac
이 블로그는 2020년 11월 18일(수), Google TensorFlow 블로그 기사를 영한 번역한 것입니다. 또한 이 번역 글은 정보 공유 목적으로만 작성했으므로 어떠한 상업용으로 사용할 수 없으며, 원본 저작물 모두 구글에게 저작권이 있음을 알려 드립니다. (First Draft Version)


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari