728x90 ๐ Research/Detection & Segmentation17 [๊ฐ๋จ ์ค๋ช ] Semi-Supervised Semantic Segmentation / Segmentation์์ unlabeled ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ํ์ตํ๋ ๋ฐฉ๋ฒ Semi-supervised semantice segmentation ์ด๋ผ๋ ๋ถ์ผ๋ฅผ ์ค๋ช ํ๊ธฐ ์ํด ์๋ ๋ ผ๋ฌธ๋ค์ ์๊ฐํฉ๋๋ค. Semi-supervised semantic segmentation needs strong, varied perturbations (BMVC 2020) Semi-Supervised Semantic Segmentation with Cross-Consistency Training (CVPR 2020) Guided Collaborative Training for Pixel-wise Semi-Supervised Learning (ECCV 2020) PSEUDOSEG: DESIGNING PSEUDO LABELS FOR SEMANTIC SEGMENTATION (ICLR 2021) Semi-s.. 2022. 1. 13. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Feature Pyramid Networks for Object Detection / FPN / ๊ฐ์ฒด์ ์ค์ผ์ผ์ invariantํ ๋คํธ์ํฌ Object detection ๋ฟ๋ง ์๋๋ผ segmentation ๋ถ์ผ์์๋ ์์ฃผ ์ฐ์ด๋ FPN(Feature Pyramid Network) ๊ตฌ์กฐ๋ฅผ ์ค๋ช ํฉ๋๋ค. FPN(Feature Pyramid Network) Object detection๊ณผ segmentation ๋ถ์ผ์์๋ object๋ฅผ scale invariant ํ๊ฒ ์ ๊ตฌ๋ณํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ์ด์ ์ฐ๊ตฌ์์๋ input ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ๋ฐ๊ฟ๊ฐ๋ฉฐ object๋ฅผ ์ฐพ์์ง๋ง ์ด๋ ๋ฉ๋ชจ๋ฆฌ์ ๊ณ์ฐ๋ ์ธก๋ฉด์์ ๋ญ๋น์ ์ ๋๋ค. ๊ทธ์ ๋นํด FPN์ ํจ์จ์ ์ผ๋ก object scale์ invariantํ feature๋ค์ ์ถ์ถํ ์ ์๋ ๋คํธ์ํฌ์ ๋๋ค. ๋ ผ๋ฌธ์์ ๋งํ๋ 'pyramid' ๋ผ๋ ๋จ์ด๋ ์๋ก ๋ค๋ฅธ resolution์ feature๋ฅผ ์์์ฌ๋ฆฐ ํํ๋ฅผ.. 2022. 1. 13. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Efficient RGB-D Semantic Segmentation for Indoor Scene Analysis / RGB-D ์์์์์ segementation ๋ณธ ๋ ผ๋ฌธ์ 2021๋ International Conference on Robotics and Automation (ICRA) ๋ผ๋ ํํ์ ๊ฒ์ฌ๋์๊ณ , RGB+depth image ๋ก semantic segmentation task๋ฅผ ์ํํ๋ ์ฐ๊ตฌ๋ฅผ ์๊ฐํ๊ธฐ ์ํด ์ค๋ช ํฉ๋๋ค. Depth ์ด๋ฏธ์ง๋ ๊ด์ธก์(์นด๋ฉ๋ผ) ์์ ๊ฑฐ๋ฆฌ๋ฅผ ํํํ๋ฏ๋ก RGB ์ด๋ฏธ์ง์์๋ ๊ฐ์ฒด๊ฐ ๋ถ๋ฆฌ๋๋ ์ง์ ์ฒ๋ผ ๋ณด์ผ์ง๋ผ๋(์กฐ๋ช , ๊ทธ๋ฆผ์์ ๋ฐ๋ผ) depth ์ด๋ฏธ์ง์์๋ ๋์ผํ(continuousํ) ๊ฐ์ฒด๋ก ๋ณด์ผ ์ ์๊ธฐ ๋๋ฌธ์ RGB ์ด๋ฏธ์ง์ depth ์ด๋ฏธ์ง๋ฅผ ํจ๊ป ์ฌ์ฉํ๋ฉด segmentation ์ฑ๋ฅ์ด ์ฌ๋ผ๊ฐ ๊ฒ์ด๋ผ ์์ธกํ ์ ์์ต๋๋ค. (๋ณธ ๋ ผ๋ฌธ์์๋ depth ์ด๋ฏธ์ง๊ฐ rgb ์ด๋ฏธ์ง์ complementary geometric in.. 2022. 1. 12. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Pyramid Scene Parsing Network / PSPNet / Pyramid Pooling ๋ณธ ๋ ผ๋ฌธ์ CVPR2017์ ๊ฒ์ฌ๋์์ผ๋ฉฐ PSPNet(ImageNet scene parsing challenge 2016์์ 1๋ฑ)์ ์ ์ํฉ๋๋ค. ํ์ฌ๋ ๋ ์ฑ๋ฅ์ด ์ข์ ์ฐ๊ตฌ๊ฐ ๋ง์ด ์๊ฐ๋์์ง๋ง semantic segmentation์ global contextual information์ ํ์ฉํ๊ธฐ ์ํ Pyramid Pooling Module ์ ์ ๋ฆฌํ๊ธฐ ์ํด ๋ฆฌ๋ทฐ๋ฅผ ์์ฑํฉ๋๋ค. Motivation ๋ณธ ๋ ผ๋ฌธ์์๋ ๊ธฐ์กด์ segmentation ์๊ณ ๋ฆฌ์ฆ์ 3๊ฐ์ง ๋ฌธ์ ์ ์ด ์๋ค๊ณ ์ง์ ํฉ๋๋ค. (์ ๊ทธ๋ฆผ์์๋ FCN ๊ณผ ๋น๊ต) 1) Mismatched Relationship : ์ฃผ๋ณ ํ๊ฒฝ(contextual information)๊ณผ ๋ง์ง ์๋ ํฝ์ ๋ถ๋ฅ. ์๋ฅผ ๋ค์ด ํธ์ ๊ทผ์ฒ์ ์๋์ฐจ, ๋๋ก ์์ ๋ณดํธ ๊ฐ์.. 2021. 12. 5. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Unified Perceptual Parsing for Scene Understanding / UperNet / Multi-task learning ๋ณธ ๋ ผ๋ฌธ์ ECCV 2018์ ๊ฒ์ฌ๋ ๋ ผ๋ฌธ์ผ๋ก ๋ค์ํ visual concepts ์ธ์ํ๋(multi-task learning) Unified Perceptual Parsing ์ด๋ผ๋ ์๋ก์ด task ๋ฅผ ์ ์ํฉ๋๋ค. Introduction ์ ๊ทธ๋ฆผ์ ๊ฑฐ์ค(scene)์ ํ ์ด๋ธ, ๊ทธ๋ฆผ, ๋ฒฝ๊ณผ ๊ฐ์ ๋ค์ํ ๊ฐ์ฒด(object)๋ก ์ด๋ฃจ์ด์ ธ์๊ณ ๋์์ ํ ์ด๋ธ์ ํ ์ด๋ธ ๋ค๋ฆฌ, ์ํ, apron(part) ๋ฑ์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. ๋ํ ํ ์ด๋ธ์ ๋๋ฌด(material)๋ก ๋ง๋ค์ด์ก๊ณ ์ํ ํ๋ฉด์ kinitted(texture) ๋์ด ์์ต๋๋ค. ์ด๋ฌํ ์นดํ ๊ณ ๋ฆฌ๋ค์ scene understanding, object/material/part/texture recognition task์์ ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ์ํ๋์ด ์์ต๋๋ค... 2021. 12. 4. ์ด์ 1 2 3 ๋ค์ 728x90