728x90 ๐ Research58 [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers ๋ณธ ๋ ผ๋ฌธ์ NeurIPS 2021 ์ ๊ณต๊ฐ๋์๊ณ , ์ฌํํ๊ณ ๊ฐ๋ ฅํ semantic segmentation task ์ฉ Transformer ์ธ SegFormer ๋ฅผ ์ ์ํ๋ ๋ ผ๋ฌธ์ ๋๋ค. Abstract ๋ณธ ๋ ผ๋ฌธ์์๋ ํจ์จ์ ์ธ Segmentation task ์ํ์ ์ํ ๊ฐ๋จํ๊ณ ํจ์จ์ ์ด๋ฉด์ ๊ฐ๋ ฅํ semantic segmentation ํ๋ ์์ํฌ์ธ SegFormer ๋ฅผ ์ ์ํฉ๋๋ค. SegFormer ๋ 1) multi-scale feature ๋ฅผ ์ถ์ถํ๋ ์๋ก์ด hierarchically structured Transformer encoder ๋ก ๊ตฌ์ฑ๋๊ณ , positional encoding์ด ํ์ํ์ง ์๊ธฐ ๋๋ฌธ์ ํ ์คํธ ์ด๋ฏธ์ง์ ํด์๋๊ฐ ํ์ต ์ด๋ฏธ์ง์ ํด์๋์ ๋ค๋ฅผ ๋ ์ฑ๋ฅ์ด ์ ํ๋๋ positiona.. 2022. 8. 9. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Deep Learning for Large-Scale Traffic-Sign Detection and Recognition / ๊ตํต ํ์งํ ๊ฒ์ถ ๋ณธ ํฌ์คํ ์์๋ Traffic sign detection (๊ตํต ํ์งํ ๊ฐ์ง) ์ ๋ํ ๋ ผ๋ฌธ 2๊ฐ๋ฅผ ์๊ฐํฉ๋๋ค. Traffic-Sign Detection and Classification in the Wild / CVPR 2016 Deep Learning for Large-Scale Traffic-Sign Detection and Recognition / IEEE T-ITS 2019 Traffic sign detection ์ object detection์ ํ์ task๋ก ๋ณผ ์ ์๊ณ , ์์จ ์ฃผํ ๋ฐ ๋๋ก ์ ๋ณด๋ฅผ ์์ฑํ๋๋ฐ ํ์์ ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ๊ต์ฅํ ์์ ๊ฐ์ฒด๋ฅผ ๊ฐ์งํ๋ ๋ฐฉ๋ฒ๋ค์ด ๊ถ๊ธํ์๋๋ฐ, traffic sign detection ๋ ผ๋ฌธ๋ค์ด ๋์์ด ๋๋ ๊ฒ ๊ฐ์ต๋๋ค. "Traffic-Sign De.. 2022. 7. 8. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Class-Balanced Loss Based on Effective Number of Samples / Class imbalance๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํ ๋ฐฉ๋ฒ Class Imabalance ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ CVPR 2019์ ๊ณต๊ฐ๋ ๋ ผ๋ฌธ์ ์๊ฐํฉ๋๋ค. ์ด๋ฒ ๋ฆฌ๋ทฐ๋ ๋ฌธ์ ์ ์์ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์ ๊ฐ๋ ์ ์ผ๋ก ์ค๋ช ํฉ๋๋ค. (๋ํ ์ผ ์ ์ธ) Class Imbalance ? Class Imbalance ๋ฌธ์ ๋ผ๋ ๊ฒ์ ๋ฅ๋ฌ๋์์ ๋คํธ์ํฌ๋ฅผ ํ์ต์ํฌ ๋ ์ฌ์ฉ๋๋ training data ์ class ๊ฐ์๊ฐ balance ๊ฐ ๋ง์ง ์๋ ์ํฉ์ ๋งํฉ๋๋ค. ์ค์ ๋ฐ์ดํฐ์์๋ ๋งค์ฐ ๋น๋ฒํ ์ผ์ด๊ธฐ์ ์ค์ํ task ๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค. ํ๊ณ์์๋ Long tail data ๋ผ๋ ๋ฐ์ดํฐ ๊ฐ์๊ฐ ๋ง์ class ๋ถํฐ ์์ฃผ ์ ์ class ๊น์ง ๋ค์ํ๊ฒ ๋ถํฌํ๋ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ class imabalance ๋ฌธ์ ์์ ์ฑ๋ฅ์ ๋น๊ตํฉ๋๋ค. ์ผ๋ฐ์ ์ธ ํด๊ฒฐ ๋ฐฉ๋ฒ ? Clas.. 2022. 5. 21. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation / DeepLab v3+ / semantic segmentation์ ๊ธฐ์ด Object Detection ์ YOLO ๊ฐ ์๋ค๋ฉด Segmentation ๋ถ์ผ์์ DeepLab ์ด ์ ๋ง ์ ๋ช ํ ๊ฒ ๊ฐ์ต๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ ECCV 2018 ์ ๋ฐํ๋์ด DeepLabV3+ ๋ฅผ ์ ์ํฉ๋๋ค. Segmentation์์์ ์ค์ํ ์์๋ค์ ๋ฐฐ์ธ ์ ์๊ณ , base ์คํ ์ ์์ง๋ ๋ง์ด ์ฌ์ฉํ๊ธฐ๋ ํ๊ณ ์ ๋ ์ฐ๊ตฌํ๋ฉฐ ์ผ๋ ๋คํธ์ํฌ๋ผ ์ ๋ฆฌํด๋๋ ค ํฉ๋๋ค. Abstract Spatial Pyramid pooling module ๋๋ encoder-decoder ๊ตฌ์กฐ๋ semantic segmentation ์์ ์ ์ํด deep neural network์ ์ฌ์ฉ๋ฉ๋๋ค. ์ ์๋ multiple effective FoV ์์ filter ๋๋ pooling ์ผ๋ก ๋ค์ด์ค๋ feature์ multi-sca.. 2022. 5. 15. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] END-TO-END OPTIMIZED IMAGE COMPRESSION | ๋ฅ๋ฌ๋ ๋ฐฉ์์ ์์ ์์ถ ICLR 2017 ์ ๋ฐํ๋ ๋ ผ๋ฌธ์ผ๋ก ์ ๋ชฉ ๊ทธ๋๋ก end-to-end ๋ฐฉ์์ผ๋ก ์ด๋ฏธ์ง ์์ถ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ต์ ํํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ ๋ ผ๋ฌธ์ ๋๋ค. ์ด ๋ถ์ผ์ ๋ํ ์ง์์ด ๊ทธ๋ ๊ฒ ๋ง์ง ์์์ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ๊ฐ ํ์ (?)ํ ์ ์์ต๋๋ค... ใ - ๊ธฐ๋ณธ์ ์ธ ์์ ์์ถ ์ค๋ช : https://mvje.tistory.com/86?category=1033082 ์์ ์์ถ - JPEG, MPEG ์์ ์์ถ ๊ด๋ จ ๋ด์ฉ์ ๋ค์ ๊ณต๋ถํ ๊ธฐํ๊ฐ ์๊ฒจ์ ๊น๋จน๊ธฐ ์ ์ ์ ๋ฆฌํฉ๋๋ค! ๋ฏธ๋์ด ๋ฐ์ดํฐ๋ ๊ธฐํ๊ธ์์ ์ผ๋ก ๋ง์์ง๊ณ ์ด๋ฅผ ์ ์ฅํ ๊ณต๊ฐ์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์ ์์ ์์ถ์ ์ค์ํ mvje.tistory.com Abstract Nonlinear analysis transformation, uniform quantizer, no.. 2022. 5. 14. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] MVSNet: Depth Inference for Unstructured Multi-view Stereo / ๋ฅ๋ฌ๋์ ์ด์ฉํ Multi-view Stereo Reconstruction ๋ฐฉ๋ฒ ์์์ N๊ฐ์ view๋ฅผ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ Multi-view Stereo Reconstuction task์์ ์ ํต์ ์ธ ๋ฐฉ๋ฒ์ด ์๋, CNN ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํ๋ ํ์ต ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ์ ์ ์ํ๋ ์ฒซ ์ฐ๊ตฌ์ด๊ธฐ์ ์๊ฐํ๋ ค ํฉ๋๋ค. ์ง๊ธ์ ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ MVSNet ๋ณด๋ค ์ฑ๋ฅ์ด ์ข์ ๋คํธ์ํฌ๊ฐ ๋ง์ง๋ง, ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ ์์ด๋์ด๋ฅผ ์ฌ์ฉํ๋ ์ฐ๊ตฌ๊ฐ ๋ง์ต๋๋ค. (22๋ ์ด ๊ธฐ์ค SoTA๋ Transformer ๊ธฐ๋ฐ์ TransMVSNet์ ๋๋ค.) Abstract ๋ณธ ๋ ผ๋ฌธ์์๋ multi-view(๋ค์์ ) ์ด๋ฏธ์ง์์ depth map inference๋ฅผ ์ํ end-to-end ๋ฅ๋ฌ๋ ์ํคํ ์ฒ๋ฅผ ์๊ฐํฉ๋๋ค. ๋คํธ์ํฌ์์ ๋ค์์ ์ด๋ฏธ์ง๋ค์ feature๋ฅผ ์ถ์ถํ ํ ๋ฏธ๋ถ๊ฐ๋ฅํ homography warping.. 2022. 3. 29. ์ด์ 1 ยทยทยท 3 4 5 6 7 8 9 10 ๋ค์ 728x90