본문 바로가기
728x90

🏛 Research58

[간단 설명] 기본적인 CNN 아키텍처 설명 | VGGNet, ResNet, Densenet VGGNet - Very Deep Convolutional Networks for Large-Scale Image Recognition / arXiv 2014 ResNet - Deep Residual Learning for Image Recognition / CVPR 2016 Densenet - Densely Connected Convolutional Networks / CVPR 2017 VGGNet VGGNet은 AlexNet보다 network의 layer가 2배이상 깊어지며 더욱 복잡한 task를 해결할 수 있습니다. Network layer 가 깊어지고 성능이 향상될 수 있었던 이유는 VGGNet부터 convolutional filter를 3x3 size를 사용하여 네트워크를 깊게 쌓기 시작했기 때.. 2022. 2. 2.
[논문 리뷰] A Simple Framework for Contrastive Learning of Visual Representations / SimCLR / Self-supervised Self-spuervised learning 에서 좋은 성능을 내는 Contrasive learning 이라는 개념을 소개하기 위해 ICML2020에 게재된 본 논문을 설명합니다. 아래 사이트에 그림으로 설명이 잘 되어 있어서, 자세한 내용은 참고바랍니다. https://amitness.com/2020/03/illustrated-simclr/ Contrasive Learning 우선, contrasive learning 은 2개의 input을 네트워크에 주입했을 때, 이들이 similar 한 input 인지 different한 input 인지를 구별해주기 위한 학습 방법입니다. 예를 들어, 아래 그림에서는 Image는 고양이와는 similar 하고 강아지, 코끼리와는 different 합니다. 그런데, .. 2022. 1. 27.
[논문 리뷰] FaPN: Feature-aligned Pyramid Network for Dense Image Prediction 본 논문은 FaPN(Feature-aligned Pyramid Network)를 제안하여 ICCV2021에 게재된 논문입니다. Motivation 대부분의 segmentation 연구에서 feature alignment 는 무시되어 왔습니다. 본 논문에서는 pixel들의 transformation offset을 학습하여 upsampling된 higher-level feature들을 상황에 맞게 align하는 feature alignment module을 제안합니다. 그리고 rich spatial detail으로 lower-feature를 강조하는 feature selection module을 제안합니다. 이게 무슨 말이나면, 위 figure의 FPN(Feature Pyramid Network)을 보면 t.. 2022. 1. 19.
[간단 설명] Semi-Supervised Semantic Segmentation / Segmentation에서 unlabeled 데이터를 사용하여 학습하는 방법 Semi-supervised semantice segmentation 이라는 분야를 설명하기 위해 아래 논문들을 소개합니다. Semi-supervised semantic segmentation needs strong, varied perturbations (BMVC 2020) Semi-Supervised Semantic Segmentation with Cross-Consistency Training (CVPR 2020) Guided Collaborative Training for Pixel-wise Semi-Supervised Learning (ECCV 2020) PSEUDOSEG: DESIGNING PSEUDO LABELS FOR SEMANTIC SEGMENTATION (ICLR 2021) Semi-s.. 2022. 1. 13.
[논문 리뷰] Feature Pyramid Networks for Object Detection / FPN / 객체의 스케일에 invariant한 네트워크 Object detection 뿐만 아니라 segmentation 분야에서도 자주 쓰이는 FPN(Feature Pyramid Network) 구조를 설명합니다. FPN(Feature Pyramid Network) Object detection과 segmentation 분야에서는 object를 scale invariant 하게 잘 구별하는 것이 중요합니다. 이전 연구에서는 input 이미지의 크기를 바꿔가며 object를 찾았지만 이는 메모리와 계산량 측면에서 낭비적입니다. 그에 비해 FPN은 효율적으로 object scale에 invariant한 feature들을 추출할 수 있는 네트워크입니다. 논문에서 말하는 'pyramid' 라는 단어는 서로 다른 resolution의 feature를 쌓아올린 형태를.. 2022. 1. 13.
[논문 리뷰] Efficient RGB-D Semantic Segmentation for Indoor Scene Analysis / RGB-D 영상에서의 segementation 본 논문은 2021년 International Conference on Robotics and Automation (ICRA) 라는 학회에 게재되었고, RGB+depth image 로 semantic segmentation task를 수행하는 연구를 소개하기 위해 설명합니다. Depth 이미지는 관측자(카메라) 와의 거리를 표현하므로 RGB 이미지에서는 객체가 분리되는 지점처럼 보일지라도(조명, 그림자에 따라) depth 이미지에서는 동일한(continuous한) 객체로 보일 수 있기 때문에 RGB 이미지와 depth 이미지를 함께 사용하면 segmentation 성능이 올라갈 것이라 예측할 수 있습니다. (본 논문에서는 depth 이미지가 rgb 이미지에 complementary geometric in.. 2022. 1. 12.
728x90