딥러닝 = 선형 변환+비선형 변환

1차 선형 방정식 + 활성화 함수가 만들어내는 강력한 모델링 파워

Apr 29. 2025

� 딥러닝의 본질을 다시 묻다

딥러닝은 데이터를 학습하고 패턴을 찾아내는 놀라운 기술입니다. 그러나 그 기본 메커니즘을 들여다보면, 의외로 단순한 구조로 이루어져 있습니다.

바로, 선형 변환(linear transformation)과 비선형 변환(nonlinear activation) 의 반복적인 조합입니다.

⚙️ 선형 변환: 계산의 단순화

딥러닝은 입력 벡터에 가중치(weight)를 곱하고 편향(bias)를 더하는 1차 선형 방정식부터 시작합니다.
z=Wx+b
이 과정은 계산이 빠르고, 최적화가 쉬운 특징을 가집니다. 하지만, 이 선형 변환만으로는 복잡한 현실

세계를 충분히 설명할 수 없습니다. 선형 변환만 계속하면, 결국 하나의 거대한 선형 변환에 불과합니다.

� 비선형 변환: 복잡성을 추가하다

현실 세계는 단순한 직선적 관계를 넘어서, 복잡하고 비선형적인 패턴으로 가득 차 있습니다. 이를 모델링하기 위해 딥러닝은 활성화 함수(activation function) 를 적용합니다.
a=ϕ(z)
활성화 함수는 모델이 직선적 한계를 넘어 다양한 곡선과 경계를 학습할 수 있게 합니다. 대표적인 활성화