728x90 반응형 Random Undersampling1 [데이터 불균형][해결방안] Random UnderSampling 분류문제에서 우리가 예측하고자 하는 값(target)이 불균형이라면, 그 상태로 모델을 학습시킨다면 recall, precision 성능지표가 매우 낮게 나올 것입니다. 이진분류로 예를 들면 target : 0의 값이 target : 1의 값보다 압도적으로 많다면 0에 대해서는 충분히 학습이 되겠지만 1에 대해서는 충분히 학습되지 못해 1을 잘 예측하지 못하게 되고 recall, precision이 낮아지게 되는 것입니다. 따라서 Target이 불균형이라면 균형을 맞춰 균형있는 학습을 할 수 있게 해야합니다. 그 방법으로는 크게 2가지가 있습니다. - oversampling : 낮은 비중을 차지하는 클래스의 값을 더 많이 생성해 높은 비중의 클래스 값에 맞추는 기법 - undersampling : 높은 .. 2022. 2. 11. 이전 1 다음 728x90 반응형