Boostcamp AI Tech

[주말 실험 일지_일] Image Classification

ju_young 2021. 8. 30. 23:46
728x90

Data Imbalance

1. 데이터가 30~50세에 편향되어 있는 것을 확인 -> 특히 50세에 집중적으로 분포되어있기 때문에 55세 이상 60세 미만인 이미지를 60세로 labeling해서 균형을 맞추는 것을 생각 -> 10% ~ 50%를 10%단위로 적용 -> earlystopping의 patience 5를 적용시 학습이 일찍 끝나는 문제가 발생하여 patience 10을 적용하고 60세 비중이 높을 수록(60세로 넘기는 비율이 높을 수록) f1 score가 낮아짐 -> overfitting의 위험이 낮아졌다고 생각

CutMix

1. 토요일 resnet50을 사용하여 중년층에 50% 적용한 결과 제출 -> 기본 모델도 f1 score가 0.3 하락 -> 무언가 잘못되었다고 판단 -> train, valid set 모두 cutmix를 적용시켰기 때문이었다고 생각.... -> train set과 valid set에 각각 다른 augmentation을 적용하는 것으로 수정 작업

728x90