딥러닝 이미지 분류 개념 초보자 가이드

딥러닝 개념 및 발전 소개 아카이빙

by 김리지

Apr 3. 2026

이미 많은 분들이 기술 블로그를 운영하시고 양질의 글을 작성해주셨습니다. 저는 이러한 생각이 들었습니다.

좋은 글들이 있는데 내가 글을 또 작성하기 민망하다.

흩어진 논문과 글들을 아카이빙 하는 건 유효할 것이다.

AI 자체가 인공지능인데 그에 대한 설명은 AI가 잘 할 것이다.

이와 같은 생각을 바탕으로 글들을 아카이빙 하며 때론 도움받을 필요가 있을을 때는 AI한테 외주(?) 맡기는 방법을 채택했습니다. 이를 종합하여 다시 글을 작성하여 정리합니다.

이 글을 끝까지 읽으시면 딥러닝 공부에 도움되는 프롬프트 정리 내용을 알 수 있습니다.

이미지 분류 소개

이미지 분류는 인공지능 모델이 그림에 쓰여진 숫자가 0인지 1인지 분류하는 기본적인 데이터셋과 모델이 있습니다. 이로부터 발전하여 더 자세한 그림 이미지를 통해 개인지 고양이인지 레이블을 구분하는 역할을 수행하게 됩니다.

이미지 분류에 대해서 잘 설명된 글이 있어서 링크를 참고하며 긴 개념 설명은 이로 대체하고 저는 논문과 블로그 아카이빙을 해보도록 하겠습니다.
https://brunch.co.kr/@dc6d817eaf3b480/20

이미지 분류 - 일상 속의 편리함

AI 기술 및 산업 분석기 #1 | Image Classification (이미지 분류) 기술은 AI를 이용한 대표적인 기술입니다. 2012년 이미지 인식 경진 대회에서 딥러닝 모델이 최초로 우승을 차지하고, 2016년에는 무려 96%

https://brunch.co.kr/@dc6d817eaf3b480/20

VGG

Very Deep Convolutional Networks for Large-Scale Image Recognition
https://arxiv.org/abs/1409.1556

Very Deep Convolutional Networks for Large-Scale Image Recognition

In this work we investigate the effect of the convolutional network depth on its accuracy in the large-scale image recognition setting. Our main contribution is a thorough evaluation of networks of increasing depth using an architecture with very small (3x

https://arxiv.org/abs/1409.1556v6

요약

VGGNet은 2014년 ILSVRC에서 2위를 차지하며 딥러닝 모델의 깊이가 성능에 미치는 영향을 입증한 기념비적인 모델입니다.

특징: 모든 컨볼루션 레이어에 3 \times 3 크기의 작은 필터만을 고집하여 사용했으며, 이를 여러 층 쌓아 큰 필터와 동일한 수용 영역(Receptive Field)을 확보하면서 층의 깊이를 깊게 설계했습니다.

장점: 구조가 매우 단순하고 직관적이어서 이해와 구현이 쉬우며, 다양한 컴퓨터 비전 작업에서 전이 학습(Transfer Learning)을 위한 기초 모델(Backbone)로 여전히 널리 활용됩니다.

단점: 모델의 마지막 단계에 위치한 Fully Connected Layer로 인해 파라미터의 개수가 매우 많고(약 1억 3,800만 개), 이로 인해 연산량과 메모리 소모가 극심하다는 한계가 있습니다.

블로그 설명

[DL - 논문 리뷰] Very Deep Convolutional Networks for Large-Scale Image Recognition(VGG)
https://jjuon.tistory.com/23

[DL - 논문 리뷰] Very Deep Convolutional Networks for Large-Scale Image Recognition(VGG)

이번 포스팅에서는 VGG로 알려져 있는 Karen Simonyan & Andrew Zisserman이 2014년에 발표한 "Very Deep Convolutional Networks for Large-Scale Image Recognition"을 읽고 정리해 보도록 하겠습니다. VGG는 ILSVRC-2014에서 top-5 e

https://jjuon.tistory.com/23

[논문 리뷰] VGG (VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION) https://resultofeffort.tistory.com/130

[논문 리뷰] VGG (VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION)

Abstract이 연구는 합성곱 신경망의 깊이가 대규모 이미지 인식 정확도에 미치는 영향을 조사합니다. 저자들은 3x3 크기의 매우 작은 합성곱 필터를 사용하여 네트워크 깊이를 증가시

https://resultofeffort.tistory.com/130

ResNet

Deep Residual Learning for Image Recognition
https://arxiv.org/abs/1512.03385

Deep Residual Learning for Image Recognition

Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions with

https://arxiv.org/abs/1512.03385v1

요약
ResNet(Residual Network)은 딥러닝 모델이 깊어질수록 오히려 성능이 저하되는 문제를 해결하기 위해 제안된 혁신적인 구조입니다.

특징: 입력값을 출력값에 직접 더해주는 Residual Learning(잔차 학습)과 Skip Connection 구조를 도입하여 정보의 손실 없이 층을 매우 깊게 쌓을 수 있습니다.

장점: 역전파 과정에서 Gradient Vanishing(기울기 소실) 문제를 효과적으로 방지하며, 층이 깊어짐에 따라 모델의 표현력과 정확도가 비약적으로 향상됩니다.

단점: 층이 많아질수록 연산량이 급증하고 학습 속도가 느려지며, 모델의 파라미터 수가 많아져 메모리 사용량이 크게 증가한다는 점이 있습니다.

블로그 설명
[Paper review] Resnet - Deep Residual Learning for Image Recognition (2015, CVPR)
https://woongchan789.tistory.com/9

[Paper review] Resnet - Deep Residual Learning for Image Recognition (2015, CVPR)

너무 늦은 리뷰이지만 공개 당시에 획기적인 방법과 높은 성능으로 인해 아직까지도 backbone으로 많이 응용되고 있는 Resnet 논문을 리뷰해보고자 한다. [Deep Residual Learning for Image Recognition 원문 링

https://woongchan789.tistory.com/9

[논문리뷰] ResNet (Deep Residual Learning for Image Recognition)
https://beginnerdeveloper-lit.tistory.com/159

[논문리뷰] ResNet (Deep Residual Learning for Image Recognition)

ResNet https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image Recognition Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used

https://beginnerdeveloper-lit.tistory.com/159

MobileNet

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
https://arxiv.org/abs/1704.04861

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

We present a class of efficient models called MobileNets for mobile and embedded vision applications. MobileNets are based on a streamlined architecture that uses depth-wise separable convolutions to build light weight deep neural networks. We introduce tw

https://arxiv.org/abs/1704.04861v1

요약

MobileNet은 모바일 및 임베디드 기기와 같이 연산 능력이 제한된 환경에서도 효율적으로 작동하도록 설계된 경량화 모델입니다.

특징: 표준 컨볼루션을 Depthwise Separable Convolution으로 대체하여, 채널별 공간 연산과 채널 간 혼합 연산을 분리함으로써 연산량을 획기적으로 줄였습니다.

장점: 기존 모델 대비 성능 저하를 최소화하면서도 모델 크기를 매우 작게 유지하고 연산 속도를 높여, 실시간 영상 인식 서비스에 최적화되어 있습니다.

단점: 경량화 과정에서 모델의 표현력이 일부 제한되어 매우 복잡한 데이터셋에서는 ResNet 등 대형 모델에 비해 상대적으로 낮은 정확도를 보일 수 있습니다.

블로그 설명

[Paper Review] MobileNet : Efficient Convolutional Neural Networks for Mobile Vision Applications https://hyeon827.tistory.com/75

[Paper Review] MobileNet : Efficient Convolutional Neural Networks for Mobile Vision Applications

논문 원본 : https://arxiv.org/abs/1704.04861 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision ApplicationsWe present a class of efficient models called MobileNets for mobile and embedded vision applications. MobileNets are based on

https://hyeon827.tistory.com/75

[논문 읽기] MobileNet(2017) 리뷰 https://deep-learning-study.tistory.com/532

[논문 읽기] MobileNet(2017) 리뷰, Efficient Convolutional Neural Networks for Mobile Vision Applications

이번에 읽어볼 논문은 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Application 입니다. MobileNet은 Depthwise separable convolution을 활용하여 모델을 경량화했습니다. Xception은 Depthwise separable convolu

https://deep-learning-study.tistory.com/532

EfficientNet

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
https://arxiv.org/abs/1905.11946

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

Convolutional Neural Networks (ConvNets) are commonly developed at a fixed resource budget, and then scaled up for better accuracy if more resources are available. In this paper, we systematically study model scaling and identify that carefully balancing n

https://arxiv.org/abs/1905.11946v5

요약

EfficientNet은 모델의 크기와 연산 효율성 사이의 최적의 균형을 찾기 위해 제안된 혁신적인 모델입니다.

특징: 모델의 깊이(Depth), 너비(Width), 해상도(Resolution)라는 세 가지 요소를 동시에 균형 있게 조절하는 Compound Scaling 기법을 도입하여 최적의 성능을 도출합니다.

장점: 기존 모델들보다 훨씬 적은 파라미터 수와 연산량(FLOPs)으로도 압도적으로 높은 정확도를 기록하며, 자원을 매우 효율적으로 사용합니다.

단점: 최적의 스케일링 계수를 찾는 과정이 복잡하고, 특정 하드웨어 가속기(GPU/TPU) 환경에서는 구조적 특성상 실제 추론 속도가 이론만큼 빠르지 않을 수 있습니다.

블로그 설명

[19′ ICML] EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks
https://ffighting.net/deep-learning-paper-review/vision-model/efficientnet/

EfficientNet - 딥러닝 논문 리뷰

EfficientNet 논문의 핵심 내용을 리뷰합니다. 먼저 기존 방법의 문제점을 살펴봅니다. 이어서 이를 해결하기 위한 EfficientNet의 제안 방법을 살펴봅니다. 마지막으로 성능 비교 실험을 통해 EfficientNe

https://ffighting.net/deep-learning-paper-review/vision-model/efficientnet/

[Paper Review] EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks
https://hyeon827.tistory.com/38

[Paper Review] EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks논문 원본 https://arxiv.org/abs/1905.11946발표 영상 https://www.youtube.com/watch?v=BfqNoIeNzyg발표 자료 (오타 ICLR 2019 -> ICML 2019) EfficientNet: Rethinking Model Scal

https://hyeon827.tistory.com/38

딥러닝 공부 프롬프트 꿀팁!

프롬프트 예시

당신은 딥러닝 박사를 전공한 연구자이자 과학 커뮤니케이터 입니다. 높은 지식 수준을 바탕으로 대중들에게 지식을 아주 쉽게 전달하는 역할을 하고 있습니다. 페르소나인 민수는 인공지능 시대에 AI활용법을 알아야 한다는데, AI를 단순히 사용만 하기보다는 AI에 대한 지식을 알고 싶다는 생각이 들었습니다. 하지만 AI 분야는 석박사 출신이 많기 때문에 관련 전공을 하지 않은 민수로써는 지식의 벽이 매우 높았습니다. 연구자이자 과학 커뮤니케이터인 당신이 민수에게 인공지능 분야 교양 지식을 알려주는 역할을 할 것입니다. 민수는 딥러닝 이라는 말과 이미지 분류라는 말은 블로그 포스팅에서 보았는데 설명을 보아도 무슨 말인지 몰라합니다. 딥러닝의 기초 원리와 발전에 대해서 쉽게 설명한 버전과 전문가에게 설명하는 버전 2가지를 비교해서 설명해주세요.

설명은 다음과 같이 합니다.

- 이론 개념 3가지 설명

- AI 개념이 일상생활에 적용되는 사례 3가지 설명

- 마지막 질문은 다음 개념 or 더 깊은 개념 설명을 원하시나요? 주제 리스트 3가지 사례 리스트 3가지 보여주고 이러한 주제들이 있는데 궁금하신 주제 말씀해주세요.

설명한 개념들을 바탕으로 민수가 스스로 더 공부할 수 있게 격려해주세요.

라고 설명해주세요.

저의 포스팅이 도움이 되셨으면 구독 라이크 댓글을 남겨주세요!!

또한 인공지능 및 딥러닝을 공부하시면서 궁금하신 점, 프롬프트를 사용하시면서 궁금하신 점이 있다면 댓글 남겨주세요.

지금까지 읽어주셔서 감사합니다. :)

keyword

매거진의 이전글답장을 부르는 5-Step 설계도[AI웹툰] AI로 인스타툰 시작하기매거진의 다음글