본문 바로가기
728x90

segmentation9

[Meta AI] SAM (Segment Anything Model) 사용 방법 | 모든 객체를 분할하는 Vision AI 모델 SAM (Segment Anything Model) Meta 에서 SAM (Segment Anything Model) 이라는 어떤 것이든 분할할 수 있는 모델을 공개했다. 논문 제목 자체가 'Segment Anything' 인데 굉장히 자신감 넘치는 워딩이다. 간단한 설명을 살펴보면, SAM은 point나 box와 같은 입력 프롬프트를 통해 고품질 객체 마스크를 생성하며 모든 객체에 대한 마스크를 생성하는 데 사용할 수 있다고 한다. 약 1,100만 개의 이미지와 11억 개의 마스크로 구성된 데이터셋으로 학습되었으며 다양한 segmentation task에서 강력한 zero-shot 성능을 보인다고 한다. Segment Anything 웹데모 Segment Anything Meta AI Computer .. 2023. 4. 21.
[오픈소스] OpenMMLab 컴퓨터비전 오픈소스 라이브러리 | 다양한 컴퓨터비전 연구 주제 OpenMMLab OpenMMLab은 학술 연구 및 산업 응용을 위한 다양한 컴퓨터비전 오픈소스 프로젝트들을 제공한다. OpenMMLab에서는 아래와 같은 장점을 가지고 있다고 설명하는데, 굉장히 많은 프로젝트와 툴이 있기 때문에 내가 써본 것은 극히 일부이지만 필요한 기능들을 편리하게 잘 구현했다는 느낌을 받았었다. 알고리즘 재구현의 어려움을 줄이기 위한 고품질 라이브러리 제공 다양한 백엔드 및 장치를 대상으로 하는 효율적인 배포 도구 제공 컴퓨터비전 연구 및 개발을 위한 견고한 기반 구축 풀스택 툴체인으로 학술 연구와 산업 응용 프로그램 간의 격차 해소 개인적으로는 Pytorch 기반이라 좋았다... OpenMMLab은 굉장히 다양한 컴퓨터비전 연구 주제에서 최신 딥러닝 모델과 고성능 코드를 제공하기.. 2023. 4. 16.
[논문 리뷰] Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation / DeepLab v3+ / semantic segmentation의 기초 Object Detection 에 YOLO 가 있다면 Segmentation 분야에선 DeepLab 이 정말 유명한 것 같습니다. 본 논문은 ECCV 2018 에 발표되어 DeepLabV3+ 를 제안합니다. Segmentation에서의 중요한 요소들을 배울 수 있고, base 실험 시 아직도 많이 사용하기도 하고 저도 연구하며 썼던 네트워크라 정리해두려 합니다. Abstract Spatial Pyramid pooling module 또는 encoder-decoder 구조는 semantic segmentation 작업을 위해 deep neural network에 사용됩니다. 전자는 multiple effective FoV 에서 filter 또는 pooling 으로 들어오는 feature의 multi-sca.. 2022. 5. 15.
[논문 리뷰] FaPN: Feature-aligned Pyramid Network for Dense Image Prediction 본 논문은 FaPN(Feature-aligned Pyramid Network)를 제안하여 ICCV2021에 게재된 논문입니다. Motivation 대부분의 segmentation 연구에서 feature alignment 는 무시되어 왔습니다. 본 논문에서는 pixel들의 transformation offset을 학습하여 upsampling된 higher-level feature들을 상황에 맞게 align하는 feature alignment module을 제안합니다. 그리고 rich spatial detail으로 lower-feature를 강조하는 feature selection module을 제안합니다. 이게 무슨 말이나면, 위 figure의 FPN(Feature Pyramid Network)을 보면 t.. 2022. 1. 19.
[간단 설명] Semi-Supervised Semantic Segmentation / Segmentation에서 unlabeled 데이터를 사용하여 학습하는 방법 Semi-supervised semantice segmentation 이라는 분야를 설명하기 위해 아래 논문들을 소개합니다. Semi-supervised semantic segmentation needs strong, varied perturbations (BMVC 2020) Semi-Supervised Semantic Segmentation with Cross-Consistency Training (CVPR 2020) Guided Collaborative Training for Pixel-wise Semi-Supervised Learning (ECCV 2020) PSEUDOSEG: DESIGNING PSEUDO LABELS FOR SEMANTIC SEGMENTATION (ICLR 2021) Semi-s.. 2022. 1. 13.
[논문 리뷰] Feature Pyramid Networks for Object Detection / FPN / 객체의 스케일에 invariant한 네트워크 Object detection 뿐만 아니라 segmentation 분야에서도 자주 쓰이는 FPN(Feature Pyramid Network) 구조를 설명합니다. FPN(Feature Pyramid Network) Object detection과 segmentation 분야에서는 object를 scale invariant 하게 잘 구별하는 것이 중요합니다. 이전 연구에서는 input 이미지의 크기를 바꿔가며 object를 찾았지만 이는 메모리와 계산량 측면에서 낭비적입니다. 그에 비해 FPN은 효율적으로 object scale에 invariant한 feature들을 추출할 수 있는 네트워크입니다. 논문에서 말하는 'pyramid' 라는 단어는 서로 다른 resolution의 feature를 쌓아올린 형태를.. 2022. 1. 13.
728x90