본문 바로가기

🏛 Research/Detection & Segmentation17

[간단 설명] Semi-Supervised Semantic Segmentation / Segmentation에서 unlabeled 데이터를 사용하여 학습하는 방법 Semi-supervised semantice segmentation 이라는 분야를 설명하기 위해 아래 논문들을 소개합니다. Semi-supervised semantic segmentation needs strong, varied perturbations (BMVC 2020) Semi-Supervised Semantic Segmentation with Cross-Consistency Training (CVPR 2020) Guided Collaborative Training for Pixel-wise Semi-Supervised Learning (ECCV 2020) PSEUDOSEG: DESIGNING PSEUDO LABELS FOR SEMANTIC SEGMENTATION (ICLR 2021) Semi-s.. 2022. 1. 13.

[논문 리뷰] Feature Pyramid Networks for Object Detection / FPN / 객체의 스케일에 invariant한 네트워크 Object detection 뿐만 아니라 segmentation 분야에서도 자주 쓰이는 FPN(Feature Pyramid Network) 구조를 설명합니다. FPN(Feature Pyramid Network) Object detection과 segmentation 분야에서는 object를 scale invariant 하게 잘 구별하는 것이 중요합니다. 이전 연구에서는 input 이미지의 크기를 바꿔가며 object를 찾았지만 이는 메모리와 계산량 측면에서 낭비적입니다. 그에 비해 FPN은 효율적으로 object scale에 invariant한 feature들을 추출할 수 있는 네트워크입니다. 논문에서 말하는 'pyramid' 라는 단어는 서로 다른 resolution의 feature를 쌓아올린 형태를.. 2022. 1. 13.

[논문 리뷰] Efficient RGB-D Semantic Segmentation for Indoor Scene Analysis / RGB-D 영상에서의 segementation 본 논문은 2021년 International Conference on Robotics and Automation (ICRA) 라는 학회에 게재되었고, RGB+depth image 로 semantic segmentation task를 수행하는 연구를 소개하기 위해 설명합니다. Depth 이미지는 관측자(카메라) 와의 거리를 표현하므로 RGB 이미지에서는 객체가 분리되는 지점처럼 보일지라도(조명, 그림자에 따라) depth 이미지에서는 동일한(continuous한) 객체로 보일 수 있기 때문에 RGB 이미지와 depth 이미지를 함께 사용하면 segmentation 성능이 올라갈 것이라 예측할 수 있습니다. (본 논문에서는 depth 이미지가 rgb 이미지에 complementary geometric in.. 2022. 1. 12.

[논문 리뷰] Pyramid Scene Parsing Network / PSPNet / Pyramid Pooling 본 논문은 CVPR2017에 게재되었으며 PSPNet(ImageNet scene parsing challenge 2016에서 1등)을 제안합니다. 현재는 더 성능이 좋은 연구가 많이 소개되었지만 semantic segmentation에 global contextual information을 활용하기 위한 Pyramid Pooling Module 을 정리하기 위해 리뷰를 작성합니다. Motivation 본 논문에서는 기존의 segmentation 알고리즘에 3가지 문제점이 있다고 지적합니다. (위 그림에서는 FCN 과 비교) 1) Mismatched Relationship : 주변 환경(contextual information)과 맞지 않는 픽셀 분류. 예를 들어 호수 근처의 자동차, 도로 위의 보트 같은.. 2021. 12. 5.

[논문 리뷰] Unified Perceptual Parsing for Scene Understanding / UperNet / Multi-task learning 본 논문은 ECCV 2018에 게재된 논문으로 다양한 visual concepts 인식하는(multi-task learning) Unified Perceptual Parsing 이라는 새로운 task 를 제안합니다. Introduction 위 그림은 거실(scene)에 테이블, 그림, 벽과 같은 다양한 객체(object)로 이루어져있고 동시에 테이블은 테이블 다리, 상판, apron(part) 등으로 구성되어 있습니다. 또한 테이블은 나무(material)로 만들어졌고 소파 표면은 kinitted(texture) 되어 있습니다. 이러한 카테고리들은 scene understanding, object/material/part/texture recognition task에서 각각 독립적으로 수행되어 왔습니다... 2021. 12. 4.

이전 1 2 3 다음

티스토리툴바