728x90
Boostcamp AI Tech
141

[Boostcamp Day-43] Object Detection - Advanced Object Detection 2

Detector의 디자인 고려사항 작은 물체 검출하기 위해 큰 네트워크 입력 사이즈 필요 네트워크 입력 사이즈가 증가함으로서 큰 receptive field 필요 -> 많은 layer를 필요 하나의 이미지로 다양한 사이즈의 물체 검출하기 위해 모델의 용량이 더 커야함 -> 많은 파라미터 필요 YOLO v4 1. Cross Stage Partial Network (CSPNet) 정확도 유지하면서 경량화 메모리 cost 감소 다양한 backbone에서 사용가능 연산 bottleneck 제거 2. Additional Improvements Data Augmentation Mosaic Self-Adversarial Training Modified Spatial Attention Module Modified Pa..

Boostcamp AI Tech 2021.10.08

[주말 실험 일지_일] Object Detection

1. 저번에 image size를 잘못 지정하여 tf_efficientdet_d0을 다시 돌려봄 -> mAP = 0.32로 좋게 나오지 않음 -> box loss config.box_loss_weight = 0.75 // config.delta = 1.0 // #cls loss config.alpha = 1.0 // config.gamma = 2.0 // optimizer = torch.optim.AdamW(params, lr=2e-5, weight_decay=0.0001) // scheduler = CosineAnnealingLR(optimizer, T_max=20, eta_min=0) -> mAP 점수가 거의 0에 가까이 나옴... cls loss와 box loss가 비슷하게 나오게끔 paramete..

Boostcamp AI Tech 2021.10.05

[주말 실험 일지_토] Object Detection

1. mmdetection을 사용하여 retinanet_x101_32x4d_fjpn_1x_coco를 돌려보았다. optimizer는 adamw(lr=2e-05, weight_decay=0.005), lr_scheduler은 cosineannealing(warmup='linear', warmup_iters=600, warmup_ratio=0.001, min_lr=1e-7)을 적용하였다. -> 다른 optimizer와 lr_scheduler를 사용하면 점수가 오를거라 예상했지만 점수 향상은 없었다. -> epoch을 12에서 20으로 늘려보니 0.04정도 mAP가 향상되었다. 2. mmdetection을 사용하여 retinanet_x101_64x4d_fpn_2x_coco -> optimizer = dict(..

Boostcamp AI Tech 2021.10.05

[Boostcamp Day-42] Object Detection - Advanced Object Detection 1

Cascade R-CNN faster rcnn에서 postive/negative sample을 나누는 기준(0.5)에 집중하였다. 이 기준을 바꾸면 어떻게 될까라는 생각에서 cascade r-cnn이 제시된 것이다. IoU threshold에 따라 다르게 학습되었을 때 결과가 다름 Input IoU가 높을수록 높은 IoU thereshold에서 학습된 model이 더 좋은 결과를 냄 IoU threshold에 따라 다르게 학습되었을 때 결과가 다름 전반적인 AP의 경우 IoU threshold 0.5로 학습된 model이 성능이 가장 좋음 그러나 AP의 IoU threshold가 높아질수록 IoU threshold가 0.6, 0.7로 학습된 model의 성능이 좋음 학습되는 IoU에 따라 대응 가능한 I..

Boostcamp AI Tech 2021.10.05

[Boostcamp 9주차] 피어세션과 학습 회고

Day - 37 피어세션 학습회고 오늘부터 pstage가 시작인데 어떤 것부터 해야할지 모르겠다. 일단 강의를 듣고 제공된 베이스라인을 돌려보았다. Day - 38 피어세션 학습회고 Faster R-CNN의 코드를 보니 이해가 잘 안가서 많은 시간을 쏟았다. 마인드맵으로 그려보니 이해가 잘 갔던 것 같다. mmdetection으로 Faster R-CNN을 돌렸는데 backbone을 resnet50으로 돌렸을 때와 resnet101로 돌렸을 때 mAP가 똑같이 나옴 -> detectron2로 Faster R-CNN(backbone=resnet101)로 돌렸을 때도 똑같음 mAP가 나옴 Day - 39 피어세션 학습회고 mmdetection을 사용해보니 다양한 모델의 config file이 있어서 여러개 돌..

Boostcamp AI Tech 2021.10.02

[Boostcamp Day-41] EfficientDet

Model scaling Width Scaling Depth Scaling EfficinetNet Width Scaling 네트워크의 width를 scaling하는 방법은 작은 모델에서 주로 사용 더 wide한 네트워크는 미세한 특징을 잘 잡아내는 경향이 있고, 학습도 쉬움 극단적으로 넓지만 얕은 모델은 high-level 특징들을 잘 잡지 못하는 경향이 있음 Depth Scaling 네트워크의 깊이를 스케일링하는 방법은 많은 ConvNet에서 쓰이는 방법 깊은 ConvNet은 더 풍부하고 복잡한 특징들을 잡아낼 수 있고, 새로운 태스크에도 잘 일반화됨 -> 하지만 깊은 네트워크는 gradient vanishing 문제가 발생 Resolution Scaling 고화질의 input 이미지를 이용하면 Con..

Boostcamp AI Tech 2021.10.02

[Boostcamp Day-41] 1 Stage Detectors

2 Stage Detectors 1 Stage Detectors conv layer를 거쳐 feature map을 추출하는 것은 2 stage와 동일하지만 이후 RPN을 통과하지 않고 바로 객체의 위치와 종류를 찾아내는 예측을 한다. Localization, Classification이 동시에 진행된다. 전체 이미지에 대해 특징 추출, 객체 검출이 이루어진다. 속도가 빠르다 영역을 추출하지 않고 전체 이미지를 보기 때문에 객체에 대한 맥락적 이해가 높다. YOLO v1 YOLO는 별도의 Region Proposal 단계가 없고 전체 이지미에서 bounding box예측과 클래스를 예측하는 일을 동시에 진행한다. 이렇게 이미지, 물체를 전체적으로 관찰하여 추론함으로서 맥락적 이해가 높아진다. 위 그림에서 ..

Boostcamp AI Tech 2021.10.01

[Boostcamp Day-40] Neck

기존 방식 (a) Featurized image pyramid 입력 이미지의 크기를 resize하여 다양한 scale의 이미지를 네트워크에 입력하는 방법이다. 속도가 매우 느리며, 메모리를 지나치게 많이 사용한다는 문제가 있다. (b) Single feature map 단일 입력 이미지를 CNN에 입력하여 단일 feature map을 통해 object detection을 수행하는 방법이다. 속도가 매우 빠르지만 성능이 떨어진다. (c) Pyramidal feature hierarchy CNN에서 미리 지정한 convolution layer마다 feature map을 추출하여 detection하는 방법이다. multi-scale feature map을 사용하기 때문에 성능이 높다는 장점이 있지만 featu..

Boostcamp AI Tech 2021.10.01

[Boostcamp Day-39] Object Detection Library

MMDetection - 라이브러리 및 모듈 Import # 모듈 import from mmcv import Config from mmdet.datasets import build_dataset from mmdet.models import build_detector from mmdet.apis import train_detector from mmdet.datasets import (build_dataloader, build_dataset, replace_ImageToTensor) - config 파일 불러오기 # config file 들고오기 cfg = Config.fromfile('./configs/faster_rcnn/faster_rcnn_x101_32x8d_fpn_mstrain_3x_coco.py'..

Boostcamp AI Tech 2021.09.30

[Boostcamp Day-38] Faster R-CNN

Faster R-CNN 마인드 맵 https://www.edrawmind.com/online/map.html?sharecode=615405c4d78a53a43983982 EdrawMind: Online Mind Mapping & Brainstorming Software www.edrawmind.com generate_anchor_base 1. 9개의 anchor box 생성 2. 각 anchor box는 y_min, x_min, y_max, y_max 순서로 좌표값을 가짐 Output : 9x4 size array ProposalCreator 1. anchor : shift된 anchor box들(36864, 4), loc : rpn에서 추출된 feature map(1x1 conv -> nx64*64*9..

Boostcamp AI Tech 2021.09.30
728x90