본문 바로가기
728x90

🏛 Research/Detection & Segmentation14

[논문 리뷰] Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation / DeepLab v3+ / semantic segmentation의 기초 Object Detection 에 YOLO 가 있다면 Segmentation 분야에선 DeepLab 이 정말 유명한 것 같습니다. 본 논문은 ECCV 2018 에 발표되어 DeepLabV3+ 를 제안합니다. Segmentation에서의 중요한 요소들을 배울 수 있고, base 실험 시 아직도 많이 사용하기도 하고 저도 연구하며 썼던 네트워크라 정리해두려 합니다. Abstract Spatial Pyramid pooling module 또는 encoder-decoder 구조는 semantic segmentation 작업을 위해 deep neural network에 사용됩니다. 전자는 multiple effective FoV 에서 filter 또는 pooling 으로 들어오는 feature의 multi-sca.. 2022. 5. 15.
[간단 설명] Object Detection 기초 : RCNN, SPPNet, Fast RCNN, Faster RCNN, YOLO | 딥러닝 기반 객체 검출 기초 1. RCNN Selective search 알고리즘으로 이미지에서 객체가 있을 것 같은 위치에 box 2k개 추출 Non-maximum Suppression 으로 가장 스코어가 높은 box만 남김(box가 겹칠 때 IoU >0.5 이면 적용) 모든 box를 227x227 로 resize (비율 고려 x) Pre-train 된 네트워크에 box 이미지를 통과시켜 고정된 크기의 feature 추출 SVM classifier 학습 & Bounding box regression 단점 - Region proposal 로 추출한 수많은 개수의 영역을 모두 CNN에 통과시키기 때문에 상당히 오래 걸림 - 객체의 비율 고려하지 않고 모두 같은 크기로 resize 2. SPPNet RCNN의 단점인 고정된 입력 이미지.. 2022. 4. 5.
[논문 리뷰] FaPN: Feature-aligned Pyramid Network for Dense Image Prediction 본 논문은 FaPN(Feature-aligned Pyramid Network)를 제안하여 ICCV2021에 게재된 논문입니다. Motivation 대부분의 segmentation 연구에서 feature alignment 는 무시되어 왔습니다. 본 논문에서는 pixel들의 transformation offset을 학습하여 upsampling된 higher-level feature들을 상황에 맞게 align하는 feature alignment module을 제안합니다. 그리고 rich spatial detail으로 lower-feature를 강조하는 feature selection module을 제안합니다. 이게 무슨 말이나면, 위 figure의 FPN(Feature Pyramid Network)을 보면 t.. 2022. 1. 19.
[간단 설명] Semi-Supervised Semantic Segmentation / Segmentation에서 unlabeled 데이터를 사용하여 학습하는 방법 Semi-supervised semantice segmentation 이라는 분야를 설명하기 위해 아래 논문들을 소개합니다. Semi-supervised semantic segmentation needs strong, varied perturbations (BMVC 2020) Semi-Supervised Semantic Segmentation with Cross-Consistency Training (CVPR 2020) Guided Collaborative Training for Pixel-wise Semi-Supervised Learning (ECCV 2020) PSEUDOSEG: DESIGNING PSEUDO LABELS FOR SEMANTIC SEGMENTATION (ICLR 2021) Semi-s.. 2022. 1. 13.
[논문 리뷰] Feature Pyramid Networks for Object Detection / FPN / 객체의 스케일에 invariant한 네트워크 Object detection 뿐만 아니라 segmentation 분야에서도 자주 쓰이는 FPN(Feature Pyramid Network) 구조를 설명합니다. FPN(Feature Pyramid Network) Object detection과 segmentation 분야에서는 object를 scale invariant 하게 잘 구별하는 것이 중요합니다. 이전 연구에서는 input 이미지의 크기를 바꿔가며 object를 찾았지만 이는 메모리와 계산량 측면에서 낭비적입니다. 그에 비해 FPN은 효율적으로 object scale에 invariant한 feature들을 추출할 수 있는 네트워크입니다. 논문에서 말하는 'pyramid' 라는 단어는 서로 다른 resolution의 feature를 쌓아올린 형태를.. 2022. 1. 13.
[논문 리뷰] Efficient RGB-D Semantic Segmentation for Indoor Scene Analysis / RGB-D 영상에서의 segementation 본 논문은 2021년 International Conference on Robotics and Automation (ICRA) 라는 학회에 게재되었고, RGB+depth image 로 semantic segmentation task를 수행하는 연구를 소개하기 위해 설명합니다. Depth 이미지는 관측자(카메라) 와의 거리를 표현하므로 RGB 이미지에서는 객체가 분리되는 지점처럼 보일지라도(조명, 그림자에 따라) depth 이미지에서는 동일한(continuous한) 객체로 보일 수 있기 때문에 RGB 이미지와 depth 이미지를 함께 사용하면 segmentation 성능이 올라갈 것이라 예측할 수 있습니다. (본 논문에서는 depth 이미지가 rgb 이미지에 complementary geometric in.. 2022. 1. 12.
728x90