Boostcamp AI Tech

[Boostcamp Day-37] Object Detection Pstages

ju_young 2021. 9. 30. 00:51
728x90

 

개요

  • 데이터셋으로는 일반 쓰레기, 플라스틱, 종이, 유리 등 10 종류의 쓰레기가 찍힌 사진 데이터셋이 제공
  • Input : 쓰레기 객체가 담긴 이미지와 bbox 정보(좌표, 카테고리)가 모델의 인풋으로 사용됩니다. bbox annotation은 COCO format으로 제공
  • Output : 모델은 bbox 좌표, 카테고리, score 값을 리턴

데이터셋

  • 전체 이미지 개수: 9754장
  • 10 class: General trash, Paper, Paper pack, Metal, Glass, Plastic, Styrofoam, Plastic bag, Battery, Clothing
  • 이미지 크기: (1024, 1024)
  • 약 50%의 이미지는 학습에 활용 되며, 50%는 test에 이용

 

  • train.json : train에 쓰일 수 잇는 모든 image, annotation 정보
  • test.json : 예측해야할 이미지들의 정보

 

images:

  • id: 파일 안에서 image 고유 id, ex) 1
  • height: 512
  • width: 512
  • file_name: ex) batch_01_vt/002.jpg

annotations:

  • id: 파일 안에 annotation 고유 id, ex) 1
  • segmentation: masking 되어 있는 고유의 좌표
  • bbox: 객체가 존재하는 박스의 좌표 (x_min, y_min, w, h)
  • area: 객체가 존재하는 영역의 크기
  • category_id: 객체가 해당하는 class의 id
  • image_id: annotation이 표시된 이미지 고유 id

 

728x90

'Boostcamp AI Tech' 카테고리의 다른 글

[Boostcamp Day-38] Faster R-CNN  (4) 2021.09.30
[Boostcamp Day-37] Overview  (0) 2021.09.30
[Boostcamp 8주차] 피어세션  (0) 2021.09.24
[Boostcamp Day-36] 특강 - Part 2  (0) 2021.09.24
[Boostcamp Day-35] 특강 - Part 1  (0) 2021.09.23