학습 모델의 평가, 편향과 분산

by 노다해


앞서 모델 학습은 경사하강법(Gradient Descent)을 통해 평균제곱오차(MSE, Meas Squared Error)로 정의된 손실함수를 최소화하는 방향으로 진행되었다. 동일하게, 학습된 모델을 최종적으로 평가할 때에도 MSE를 활용할 수 있다.


앞서 모델 학습은 경사하강법(Gradient Descent)을 통해 평균제곱오차(MSE, Mean Squared Error)로 정의된 손실함수를 최소화하는 방향으로 진행되었다. 동일하게, 학습된 모델을 최종적으로 평가할 때에도 MSE를 활용할 수 있다.



1. MSE 정의


%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2025-08-18_%EC%98%A4%EC%A0%84_10.45.14.png?type=w1

ε(irreducible noise): 데이터 본질의 변동성, 측정 오차, 특성의 불완전성, 시스템의 비결정성(stochasticity) 등을 포괄





2. MSE 전개 & 독립성 가정 적용


%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2025-08-18_%EC%98%A4%EC%A0%84_10.55.31.png?type=w1





3. 최종 식


%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2025-08-18_%EC%98%A4%EC%A0%84_10.46.45.png?type=w1

첫 번째 항: Bias² (편향 제곱)

편향: 예측의 기대값과 실제 값의 차이 모델이 실제 데이터에서 얼마나 일관되게 벗어나 있는지 모델이 실제에 비해 단순한 경우


두 번째 항: Variance (분산 = 편차²의 기대값)

분산: 개별 예측값이 예측의 기대값에서 얼마나 떨어져 있는지 모델이 실제에 비해 복잡한 경우 또는 학습 데이터에 과적합













keyword
매거진의 이전글머신러닝, 지도학습, 회귀(Regression)