Albumentations 소개
머신러닝 및 딥러닝에서는 데이터가 중요합니다.
하지만, 이런 데이터를 수집하기에는 시간, 비용, 인적 자원이 너무나도 많이 필요합니다.
오죽하면, 아래와 같이 나라에서 주도적으로 AI 학습용 데이터 구축를 진행하고 있을까요...
그래도 Computer Vision 분야에서 자신이 원하는 데이터셋이 AI hub에서 제공하지 않을 수도 있고, 학습 모델의 품징을 높이기 위해 더 많은 데이터가 필요하기도 합니다.
이 때, 더 많은 데이터를 수집하기 보다 image augmentation이라는 방법을 활용합니다.
이 image augmentation의 목적은 존재하는 데이터에서 새로운 학습을 위한 데이터를 생성하는 것입니다.
이 때도 사실 그동안 파이썬에서 pillow나 opencv를 통해서 만들기도 했는데, 이 또한 귀찮은 작업이기도 했습니다.
그러나, 이제 우리 앞에 Albumentations가 있습니다. 사이트에서도 소개하듯이 CNN (Convolutional Neural Networks)의 성능을 높이기 위하 컴퓨터 비전 도구입니다. 매우 쉽고 유연하게 image augmention을 할 수 있게 도와줍니다.
https://github.com/albumentations-team/albumentations#list-of-augmentations 에서 Albumentations에서 지원하는 많은 pixel 레벨 및 spatial 레벨 augmentation들을 확인할 수 있습니다.
Streamlit으로 만든 데모 페이지도 있으니 한번 확인해 보세요.
https://demo.albumentations.ai/
이제 쉽게 Computer Vision을 성능을 높여보세요!