본문 바로가기

MachineLearning

Training & Validation & Test set

  • training set : 모델 만드는데 사용
  • validation set : training set으로 만들어진 모델의 성능 측정에 사용. 어떤 모델이 가장 데이터에 적합한지 찾아내기 위해서 다양한 파라미터와 모델을 사용해보게 되며, 그 중 validation set으로 가장 성능이 좋았던 모델을 선택(모델의 매개변수 선택)한다.
  • testing set : validation set으로 사용할 모델이 결정 된 후, 마지막으로 딱 한번 해당 모델의 예상되는 성능을 측정(선택된 매개변수의 성능 평가)하기 위해 사용된다. 이미 validation set은 여러 모델에 반복적으로 사용되었고 그중 운 좋게 성능이 보다 더 뛰어난 것으로 측정되어 모델이 선택되었을 가능성이 있다. 때문에 이러한 오차를 줄이기 위해 한 번도 사용해본 적 없는 test set을 사용하여 최종 모델의 성능을 측정하게 된다

'MachineLearning' 카테고리의 다른 글

Ensemble  (0) 2022.10.19