Boostcamp AI Tech

[Boostcamp Day-53] U-Net

ju_young 2021. 10. 22. 22:11
728x90

U-Net


  • Contracting Path : 이미지 특징 추출
    • 3x3 Conv - BN - ReLU가 2번씩 반복 : No zero-padding으로 patch size 감소
    • 2x2 Max Pooling (stride=2) : Max Pooling 이후 채널 수 2배 증가
  • Expanding Path : localization을 가능하게 함
    • 2x2 Transposed Convolution
    • Contracting 에서 얻은 Feature Map과 Concat 진행
    • 마지막에 1x1 Convolution을 진행하여 segmentation map을 출력
  • 한계
    • U-Net은 기본적으로 깊이가 4로 고정
    • 단순한 Skip Connection

U-Net++


  • Dense Skip Connection

  • 모든 depth의 모델을 을 Ensemble하는 효과가 있음
  • hybrid loss = Pixel wise Cross Entropy + Soft Dice Coefficient

  • 한계
    • 복잡한 Connnection으로 Parameter가 많아짐
    • 많은 Connection으로 인한 Memory가 많아짐
    • Encoder-Decoder 사이에어스이 Connection이 동일한 크기를 갖는 Feature map에서만 진행

U-Net 3+


  • Full-scale Skip Connections : (conventional + inter + intra) skip connection
    • conventional : encoder layer로부터 same-scale의 feature maps 받음
    • inter : encoder layer로부터 smaller-scale의 low-level feature maps 받음
    • intra : decoder layer로부터 larger-scale의 high-level feature maps받음
  • 모든 encoder layer에서 64 channel, 3x3 conv를 동일하게 적용함으로서 모든 decoder layer의 channel 수를 320으로 통일시켜 parameter 수를 줄임

  • Classification-guided Module (CGM)
    • low-level layer에 남아있는 background의 noise 발생하여 많은 false-positive 문제 발생
    • 정확도를 높이고자 extra classification task 진행
    • high-level feature map을 활용

Residual U-Net

  • Encoder 및 Decoder 부분의 block 마다 residual unit with identity mapping 적용

Mobile-UNet


Efficient U-Net

  • MBConv of Encoder

  • Encoder + Decoder
728x90