딥러닝 이미지 분류 개념 초보자 가이드

딥러닝 개념 및 발전 소개 아카이빙

by 김리지

이미 많은 분들이 기술 블로그를 운영하시고 양질의 글을 작성해주셨습니다. 저는 이러한 생각이 들었습니다.

좋은 글들이 있는데 내가 글을 또 작성하기 민망하다.

흩어진 논문과 글들을 아카이빙 하는 건 유효할 것이다.

AI 자체가 인공지능인데 그에 대한 설명은 AI가 잘 할 것이다.


이와 같은 생각을 바탕으로 글들을 아카이빙 하며 때론 도움받을 필요가 있을을 때는 AI한테 외주(?) 맡기는 방법을 채택했습니다. 이를 종합하여 다시 글을 작성하여 정리합니다.



이 글을 끝까지 읽으시면 딥러닝 공부에 도움되는 프롬프트 정리 내용을 알 수 있습니다.






이미지 분류 소개


이미지 분류는 인공지능 모델이 그림에 쓰여진 숫자가 0인지 1인지 분류하는 기본적인 데이터셋과 모델이 있습니다. 이로부터 발전하여 더 자세한 그림 이미지를 통해 개인지 고양이인지 레이블을 구분하는 역할을 수행하게 됩니다.


이미지 분류에 대해서 잘 설명된 글이 있어서 링크를 참고하며 긴 개념 설명은 이로 대체하고 저는 논문과 블로그 아카이빙을 해보도록 하겠습니다.
https://brunch.co.kr/@dc6d817eaf3b480/20




VGG

Very Deep Convolutional Networks for Large-Scale Image Recognition
https://arxiv.org/abs/1409.1556


요약

VGGNet은 2014년 ILSVRC에서 2위를 차지하며 딥러닝 모델의 깊이가 성능에 미치는 영향을 입증한 기념비적인 모델입니다.

특징: 모든 컨볼루션 레이어에 3 \times 3 크기의 작은 필터만을 고집하여 사용했으며, 이를 여러 층 쌓아 큰 필터와 동일한 수용 영역(Receptive Field)을 확보하면서 층의 깊이를 깊게 설계했습니다.

장점: 구조가 매우 단순하고 직관적이어서 이해와 구현이 쉬우며, 다양한 컴퓨터 비전 작업에서 전이 학습(Transfer Learning)을 위한 기초 모델(Backbone)로 여전히 널리 활용됩니다.

단점: 모델의 마지막 단계에 위치한 Fully Connected Layer로 인해 파라미터의 개수가 매우 많고(약 1억 3,800만 개), 이로 인해 연산량과 메모리 소모가 극심하다는 한계가 있습니다.


블로그 설명

[DL - 논문 리뷰] Very Deep Convolutional Networks for Large-Scale Image Recognition(VGG)
https://jjuon.tistory.com/23

[논문 리뷰] VGG (VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION) https://resultofeffort.tistory.com/130






ResNet


Deep Residual Learning for Image Recognition
https://arxiv.org/abs/1512.03385


요약
ResNet(Residual Network)은 딥러닝 모델이 깊어질수록 오히려 성능이 저하되는 문제를 해결하기 위해 제안된 혁신적인 구조입니다.

특징: 입력값을 출력값에 직접 더해주는 Residual Learning(잔차 학습)과 Skip Connection 구조를 도입하여 정보의 손실 없이 층을 매우 깊게 쌓을 수 있습니다.

장점: 역전파 과정에서 Gradient Vanishing(기울기 소실) 문제를 효과적으로 방지하며, 층이 깊어짐에 따라 모델의 표현력과 정확도가 비약적으로 향상됩니다.

단점: 층이 많아질수록 연산량이 급증하고 학습 속도가 느려지며, 모델의 파라미터 수가 많아져 메모리 사용량이 크게 증가한다는 점이 있습니다.


블로그 설명
[Paper review] Resnet - Deep Residual Learning for Image Recognition (2015, CVPR)
https://woongchan789.tistory.com/9


[논문리뷰] ResNet (Deep Residual Learning for Image Recognition)
https://beginnerdeveloper-lit.tistory.com/159





MobileNet



MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
https://arxiv.org/abs/1704.04861



요약

MobileNet은 모바일 및 임베디드 기기와 같이 연산 능력이 제한된 환경에서도 효율적으로 작동하도록 설계된 경량화 모델입니다.

특징: 표준 컨볼루션을 Depthwise Separable Convolution으로 대체하여, 채널별 공간 연산과 채널 간 혼합 연산을 분리함으로써 연산량을 획기적으로 줄였습니다.

장점: 기존 모델 대비 성능 저하를 최소화하면서도 모델 크기를 매우 작게 유지하고 연산 속도를 높여, 실시간 영상 인식 서비스에 최적화되어 있습니다.

단점: 경량화 과정에서 모델의 표현력이 일부 제한되어 매우 복잡한 데이터셋에서는 ResNet 등 대형 모델에 비해 상대적으로 낮은 정확도를 보일 수 있습니다.


블로그 설명

[Paper Review] MobileNet : Efficient Convolutional Neural Networks for Mobile Vision Applications https://hyeon827.tistory.com/75

[논문 읽기] MobileNet(2017) 리뷰 https://deep-learning-study.tistory.com/532





EfficientNet

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
https://arxiv.org/abs/1905.11946


요약

EfficientNet은 모델의 크기와 연산 효율성 사이의 최적의 균형을 찾기 위해 제안된 혁신적인 모델입니다.

특징: 모델의 깊이(Depth), 너비(Width), 해상도(Resolution)라는 세 가지 요소를 동시에 균형 있게 조절하는 Compound Scaling 기법을 도입하여 최적의 성능을 도출합니다.

장점: 기존 모델들보다 훨씬 적은 파라미터 수와 연산량(FLOPs)으로도 압도적으로 높은 정확도를 기록하며, 자원을 매우 효율적으로 사용합니다.

단점: 최적의 스케일링 계수를 찾는 과정이 복잡하고, 특정 하드웨어 가속기(GPU/TPU) 환경에서는 구조적 특성상 실제 추론 속도가 이론만큼 빠르지 않을 수 있습니다.


블로그 설명

[19′ ICML] EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks
https://ffighting.net/deep-learning-paper-review/vision-model/efficientnet/

[Paper Review] EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks
https://hyeon827.tistory.com/38





딥러닝 공부 프롬프트 꿀팁!


프롬프트 예시


당신은 딥러닝 박사를 전공한 연구자이자 과학 커뮤니케이터 입니다. 높은 지식 수준을 바탕으로 대중들에게 지식을 아주 쉽게 전달하는 역할을 하고 있습니다. 페르소나인 민수는 인공지능 시대에 AI활용법을 알아야 한다는데, AI를 단순히 사용만 하기보다는 AI에 대한 지식을 알고 싶다는 생각이 들었습니다. 하지만 AI 분야는 석박사 출신이 많기 때문에 관련 전공을 하지 않은 민수로써는 지식의 벽이 매우 높았습니다. 연구자이자 과학 커뮤니케이터인 당신이 민수에게 인공지능 분야 교양 지식을 알려주는 역할을 할 것입니다. 민수는 딥러닝 이라는 말과 이미지 분류라는 말은 블로그 포스팅에서 보았는데 설명을 보아도 무슨 말인지 몰라합니다. 딥러닝의 기초 원리와 발전에 대해서 쉽게 설명한 버전과 전문가에게 설명하는 버전 2가지를 비교해서 설명해주세요.

설명은 다음과 같이 합니다.

- 이론 개념 3가지 설명

- AI 개념이 일상생활에 적용되는 사례 3가지 설명

- 마지막 질문은 다음 개념 or 더 깊은 개념 설명을 원하시나요? 주제 리스트 3가지 사례 리스트 3가지 보여주고 이러한 주제들이 있는데 궁금하신 주제 말씀해주세요.

설명한 개념들을 바탕으로 민수가 스스로 더 공부할 수 있게 격려해주세요.

라고 설명해주세요.





저의 포스팅이 도움이 되셨으면 구독 라이크 댓글을 남겨주세요!!

또한 인공지능 및 딥러닝을 공부하시면서 궁금하신 점, 프롬프트를 사용하시면서 궁금하신 점이 있다면 댓글 남겨주세요.

지금까지 읽어주셔서 감사합니다. :)


매거진의 이전글답장을 부르는 5-Step 설계도