Boostcamp AI Tech

[실험 일지 Day-69] P Stage - OCR

ju_young 2021. 11. 22. 12:55
728x90
  1. annotation 작업 결과물을 다운로드 받았는데 annotation.json 파일이 비어있음 -> 다시 다운로드 받으니 정상적으로 있음
  2. 구글 드라이브를 보니 dataset_revised 라는 파일이 올라와 있음 -> illegibillity 정보를 추가하여 다시 올린 파일이라고 함
  3. 각 팀원끼리 데이터를 나누어서 검수를 진행
  4. json파일을 보니 points가 3개미만이거나 홀수인 경우가 생김 -> 3개 미만일 경우 삭제하고 4개 초과이고 홀수 인 경우에는 illegibillity=True로 변경하는 것이 좋을 것 같음
  5. 데이터를 검수하여 labeling이 잘된 data와 검수하기 전의 data 등 다양한 dataset으로 학습을 진행
  6. 전체적인 EDA를 진행
  7. autocad를 사용해서 annotation tool을 만들어보고 싶음
728x90