본문 바로가기

Computer Vision15

[CV] Scale Invariant Feature Transform (SIFT) : 영상의 스케일에 불변한 Feature Keypoint ? Keypoint(특징점)는 물체의 모양, 크기, 위치가 변해도 쉽게 식별이 가능한 위치이고 카메라의 시점, 조명이 이 변해도 이미지에서 쉽게 찾을 수 있는 위치를 뜻한다. 이러한 조건을 만족하는 위치는 대부분 corner point이고 대부분의 keypoint 추출 알고리즘들이 이러한 코너검출을 기반으로 설계되었다. * 코너가 아닌 물체의 내부 또는 배경이면 그 주변과 특징이 비슷하기 때문에 keypoint의 조건을 만족할 수 없다. 때문에 영상에서 keypoint를 추출하면 서로 다른 시점의 영상을 매칭하거나 특정 물체를 추적하는데 사용할 수 있다. Descriptor ? Keypoint는 이미지에서의 특징이 되는 좌표를 의미하고 descriptor는 해당 keypoint에서 추출한.. 2022. 3. 23.

[논문 리뷰] A Simple Framework for Contrastive Learning of Visual Representations / SimCLR / Self-supervised Self-spuervised learning 에서 좋은 성능을 내는 Contrasive learning 이라는 개념을 소개하기 위해 ICML2020에 게재된 본 논문을 설명합니다. 아래 사이트에 그림으로 설명이 잘 되어 있어서, 자세한 내용은 참고바랍니다. https://amitness.com/2020/03/illustrated-simclr/ Contrasive Learning 우선, contrasive learning 은 2개의 input을 네트워크에 주입했을 때, 이들이 similar 한 input 인지 different한 input 인지를 구별해주기 위한 학습 방법입니다. 예를 들어, 아래 그림에서는 Image는 고양이와는 similar 하고 강아지, 코끼리와는 different 합니다. 그런데, .. 2022. 1. 27.

[논문 리뷰] FaPN: Feature-aligned Pyramid Network for Dense Image Prediction 본 논문은 FaPN(Feature-aligned Pyramid Network)를 제안하여 ICCV2021에 게재된 논문입니다. Motivation 대부분의 segmentation 연구에서 feature alignment 는 무시되어 왔습니다. 본 논문에서는 pixel들의 transformation offset을 학습하여 upsampling된 higher-level feature들을 상황에 맞게 align하는 feature alignment module을 제안합니다. 그리고 rich spatial detail으로 lower-feature를 강조하는 feature selection module을 제안합니다. 이게 무슨 말이나면, 위 figure의 FPN(Feature Pyramid Network)을 보면 t.. 2022. 1. 19.

[간단 설명] Semi-Supervised Semantic Segmentation / Segmentation에서 unlabeled 데이터를 사용하여 학습하는 방법 Semi-supervised semantice segmentation 이라는 분야를 설명하기 위해 아래 논문들을 소개합니다. Semi-supervised semantic segmentation needs strong, varied perturbations (BMVC 2020) Semi-Supervised Semantic Segmentation with Cross-Consistency Training (CVPR 2020) Guided Collaborative Training for Pixel-wise Semi-Supervised Learning (ECCV 2020) PSEUDOSEG: DESIGNING PSEUDO LABELS FOR SEMANTIC SEGMENTATION (ICLR 2021) Semi-s.. 2022. 1. 13.

[논문 리뷰] Unified Perceptual Parsing for Scene Understanding / UperNet / Multi-task learning 본 논문은 ECCV 2018에 게재된 논문으로 다양한 visual concepts 인식하는(multi-task learning) Unified Perceptual Parsing 이라는 새로운 task 를 제안합니다. Introduction 위 그림은 거실(scene)에 테이블, 그림, 벽과 같은 다양한 객체(object)로 이루어져있고 동시에 테이블은 테이블 다리, 상판, apron(part) 등으로 구성되어 있습니다. 또한 테이블은 나무(material)로 만들어졌고 소파 표면은 kinitted(texture) 되어 있습니다. 이러한 카테고리들은 scene understanding, object/material/part/texture recognition task에서 각각 독립적으로 수행되어 왔습니다... 2021. 12. 4.

[논문 리뷰] Recognizing Materials Using Perceptually Inspired Features 본 논문은 2013년, International journal of computer vision 저널에 게재된 논문입니다. 거의 10년전 논문이지만, 저에게 material recognition이라는 분야를 가장 잘 이해할 수 있게 해준 논문이기에 정리해두려 합니다. Introduction 본 논문에서는 human material recognition 연구를 기반으로 하는 low, mid-level 이미지 feature를 제안하고 SVM classifier 를 사용하여 이러한 feature들을 결합합니다. 아래에는 재질 카테고리를 분류하기 위한 몇가지 특성들을 소개합니다. - Surface Reflectance Surface reflectance는 재질 종류와 상관관계가 있는 경우가 많습니다. 예를 들어.. 2021. 10. 16.

이전 1 2 3 다음

티스토리툴바