[실험 일지 Day-73] P Stage

Boostcamp AI Tech

[실험 일지 Day-73] P Stage - OCR

ju_young 2021. 11. 22. 12:58

테스트 데이터셋의 이미지들은 1500 사이즈를 넘어가지 않기때문에 ICDAR2019_ArT 데이터셋에서 1500 사이즈가 넘어가는 이미지는 제외 -> 언어는 영어, 중국어 두 종류가 있으며 영어만 뽑은 데이터셋과 중국어를 포함한 데이터셋으로 나누어 json 파일을 저장 -> 전체 이미지 중 1000장을 sampling하여 val set으로 저장
해당 대회는 문자를 인식하여 box를 그리는 것이므로 다양한 언어를 학습시키는게 좋을 거 같음
야외 촬영 이미지 데이터셋도 각 종류별로 50장씩 sampling하여 val set으로 저장
야외 촬영 이미지와 ICDAR2019_ArT를 추가하여 돌렸을 때 Loss가 잘 줄어들지 않음 -> 데이터 수가 많아서 금방 학습이 된것인가.... test set을 한 번 돌려봐야겠다 -> 중국어에 대해서 검출이 잘 안되는 문제가 발생 -> public test set에서는 중국어는 사용하지 않으니 빼는게 나을 것 같다.
ICDAR2017_MLT 데이터셋에 있는 한국어 데이터를 가져와서 추가하는게 좋을 것 같음 -> public test set에 한국어의 비중이 많기 때문