
[AI/ML] Bias와 Variance : 머신러닝 모델 평가 방법
·
📖 Fundamentals/AI & ML
Bias : 모델의 출력으로 얻은 예측값과 정답(Ground Truth) 와의 차이의 평균Variance : 다양한 데이터 셋에서 예측값이 얼마나 변화할 수 있는지에 대한 값 머신러닝에서 bias와 variance는 모델이 얼마나 잘 학습되었는지 확인하는 척도 중 하나로, 가장 좋은 경우는 bias와 variance가 모두 낮은 경우이다. (아래 그림 참고)그런데 위의 내용은 너무 당연한 내용이자 결과론적인 이야기이고, bias와 variance는 모델 학습과 연관지어 생각할 필요가 있다. 학습이 덜된 underfitting 구간에는 학습데이터 셋의 예측값도 많이 틀리기 때문에 bias가 높은 상태이고, 적절한 학습 종료 지점을 지난 구간에서는 학습 데이터셋과 모델의 loss를 최소화 하기 위해 over..