728x90
Data Imbalance
1. 데이터가 30~50세에 편향되어 있는 것을 확인 -> 특히 50세에 집중적으로 분포되어있기 때문에 55세 이상 60세 미만인 이미지를 60세로 labeling해서 균형을 맞추는 것을 생각 -> 10% ~ 50%를 10%단위로 적용 -> earlystopping의 patience 5를 적용시 학습이 일찍 끝나는 문제가 발생하여 patience 10을 적용하고 60세 비중이 높을 수록(60세로 넘기는 비율이 높을 수록) f1 score가 낮아짐 -> overfitting의 위험이 낮아졌다고 생각
CutMix
1. 토요일 resnet50을 사용하여 중년층에 50% 적용한 결과 제출 -> 기본 모델도 f1 score가 0.3 하락 -> 무언가 잘못되었다고 판단 -> train, valid set 모두 cutmix를 적용시켰기 때문이었다고 생각.... -> train set과 valid set에 각각 다른 augmentation을 적용하는 것으로 수정 작업
728x90
'Boostcamp AI Tech' 카테고리의 다른 글
[실험 일지 작성_화] Image Classification (0) | 2021.09.01 |
---|---|
[실험 일지 작성_월] Image Classification (0) | 2021.08.31 |
[주말 실험 일지_토] Image Classification (0) | 2021.08.30 |
[Boostcamp Day-19] Image Classification - Ensemble (0) | 2021.08.27 |
[Boostcamp Day-18] Image Classification - Training & Inference (0) | 2021.08.27 |