728x90 ๐ Research/Detection & Segmentation14 [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Pyramid Scene Parsing Network / PSPNet / Pyramid Pooling ๋ณธ ๋ ผ๋ฌธ์ CVPR2017์ ๊ฒ์ฌ๋์์ผ๋ฉฐ PSPNet(ImageNet scene parsing challenge 2016์์ 1๋ฑ)์ ์ ์ํฉ๋๋ค. ํ์ฌ๋ ๋ ์ฑ๋ฅ์ด ์ข์ ์ฐ๊ตฌ๊ฐ ๋ง์ด ์๊ฐ๋์์ง๋ง semantic segmentation์ global contextual information์ ํ์ฉํ๊ธฐ ์ํ Pyramid Pooling Module ์ ์ ๋ฆฌํ๊ธฐ ์ํด ๋ฆฌ๋ทฐ๋ฅผ ์์ฑํฉ๋๋ค. Motivation ๋ณธ ๋ ผ๋ฌธ์์๋ ๊ธฐ์กด์ segmentation ์๊ณ ๋ฆฌ์ฆ์ 3๊ฐ์ง ๋ฌธ์ ์ ์ด ์๋ค๊ณ ์ง์ ํฉ๋๋ค. (์ ๊ทธ๋ฆผ์์๋ FCN ๊ณผ ๋น๊ต) 1) Mismatched Relationship : ์ฃผ๋ณ ํ๊ฒฝ(contextual information)๊ณผ ๋ง์ง ์๋ ํฝ์ ๋ถ๋ฅ. ์๋ฅผ ๋ค์ด ํธ์ ๊ทผ์ฒ์ ์๋์ฐจ, ๋๋ก ์์ ๋ณดํธ ๊ฐ์.. 2021. 12. 5. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Unified Perceptual Parsing for Scene Understanding / UperNet / Multi-task learning ๋ณธ ๋ ผ๋ฌธ์ ECCV 2018์ ๊ฒ์ฌ๋ ๋ ผ๋ฌธ์ผ๋ก ๋ค์ํ visual concepts ์ธ์ํ๋(multi-task learning) Unified Perceptual Parsing ์ด๋ผ๋ ์๋ก์ด task ๋ฅผ ์ ์ํฉ๋๋ค. Introduction ์ ๊ทธ๋ฆผ์ ๊ฑฐ์ค(scene)์ ํ ์ด๋ธ, ๊ทธ๋ฆผ, ๋ฒฝ๊ณผ ๊ฐ์ ๋ค์ํ ๊ฐ์ฒด(object)๋ก ์ด๋ฃจ์ด์ ธ์๊ณ ๋์์ ํ ์ด๋ธ์ ํ ์ด๋ธ ๋ค๋ฆฌ, ์ํ, apron(part) ๋ฑ์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. ๋ํ ํ ์ด๋ธ์ ๋๋ฌด(material)๋ก ๋ง๋ค์ด์ก๊ณ ์ํ ํ๋ฉด์ kinitted(texture) ๋์ด ์์ต๋๋ค. ์ด๋ฌํ ์นดํ ๊ณ ๋ฆฌ๋ค์ scene understanding, object/material/part/texture recognition task์์ ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ์ํ๋์ด ์์ต๋๋ค... 2021. 12. 4. ์ด์ 1 2 3 ๋ค์ 728x90