728x90 ๐ Research/Detection & Segmentation14 [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] End-to-End Object Detection with Transformers | DETR ์ค๋ช ์ค๋์ 2020๋ ์ Meta์์ ๊ณต๊ฐํ DETR ๋ชจ๋ธ(ECCV 2020)์ ๋ฆฌ๋ทฐํด ๋ณด๊ณ ์ ํ๋ค. ํผ ์ธ์ฉ์๊ฐ 9000ํ์ ์ก๋ฐํ๋ฉฐ, ์ต๊ทผ ๊ณต๊ฐ๋๋ ๊ฐ์ฒด ๊ฒ์ถ ๋ ผ๋ฌธ๋ค์ ๋ณด๋ฉด DETR ๊ธฐ๋ฐ์ ์ฐ๊ตฌ๋ ์ฌ์ฌ์น ์๊ฒ ๋ณผ ์ ์๋ค. Deformable DETR, Conditional DETR, Group DETR, Co-DETR, ... DETR (DEtection TRansformer) DETR์ ํธ๋์คํฌ๋จธ์ ์ด๋ถ ๋งค์นญ(Bipartite-matching) ๊ธฐ๋ฐ์ ์๋ก์ด ๊ฒ์ถ ๋ฐฉ์์ ๋์ ํ์ฌ RPN, NMS์ ๊ฐ์ hand-crafted ํ ์์ง๋์ด๋ง์ด ํ์์๋ ๋ชจ๋ธ ๊ตฌ์กฐ๋ผ๊ณ ํ๋ค. ๊ตฌ์กฐ์ ์ผ๋ก ๊ต์ฅํ ๊ฐ๋จํ๋ฉด์ ๋ค๋ฅธ task์ ๋ํ ํ์ฅ์ฑ๋ ์ข๊ณ , ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์ด์ฉํ๊ธฐ ๋๋ฌธ์ ํฐ ๊ฐ์ฒด๋ฅผ ๊ฒ์ถ ๋ฅ๋ ฅ์ด Faste.. 2023. 11. 25. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Fast Segment Anything | Fast SAM | SAM์ ๊ฒฝ๋ํ SAM (Segment Anything Model) ์ค๋ช ๋ฐ ์ฌ์ฉ ๋ฐฉ๋ฒ [Meta AI] SAM (Segment Anything Model) ์ฌ์ฉ ๋ฐฉ๋ฒ | ๋ชจ๋ ๊ฐ์ฒด๋ฅผ ๋ถํ ํ๋ Vision AI ๋ชจ๋ธ SAM (Segment Anything Model) Meta ์์ SAM (Segment Anything Model) ์ด๋ผ๋ ์ด๋ค ๊ฒ์ด๋ ๋ถํ ํ ์ ์๋ ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ค. ๋ ผ๋ฌธ ์ ๋ชฉ ์์ฒด๊ฐ 'Segment Anything' ์ธ๋ฐ ๊ต์ฅํ ์์ ๊ฐ ๋์น๋ ์๋ฉ์ด๋ค. ๊ฐ๋จํ ์ค๋ช ์ mvje.tistory.com Meta AI์ Segment Anything Model (SAM)์ด ๊ณต๊ฐ๋์ง ์ผ๋ง๋ ๋๋ค๊ณ ๋ฒ์จ Fast SAM์ด๋ผ๋ ์๋๊ฐ ํฅ์๋ ๋ฒ์ ์ SAM์ด ๊ณต๊ฐ๋์๋ค. ๋น ํ ํฌ ๊ธฐ์ ์์ ํ์ ์ ์ธ AI ๋ชจ๋ธ์ ์ง์์ .. 2023. 7. 2. [๋ ผ๋ฌธ ์๊ฐ] TAM (Track Anything Model) | ์ด๋ค ๊ฒ์ด๋ ์ถ์ ํ๋ Vision AI ๋ชจ๋ธ | Sagment Anything ๋น๋์ค ๋ฒ์ Track Anything: Segment Anything Meets Videos ์ธ์ ์ฐธ ๋น ๋ฅด๋ค. Meta AI์ SAM (Segment Anything Model)์ด ๋์จ์ง ์ผ๋ง๋ ๋๋ค๊ณ SAM์ ๋น๋์ค์ ์ ์ฉํด tracking task๋ฅผ ์ํํ๋ TAM (Tracking Anything Model) ๋ ผ๋ฌธ์ด ๋์๋ค๊ณ ํ๋ค. Track-Anything์ ๋น๋์ค ๊ฐ์ฒด ์ถ์ ๋ฐ ๋ถํ ์ ์ํ ์ ์ฐํ ๋ํํ ๋๊ตฌ๋ก Segment Anything์์ ๊ฐ๋ฐ๋์์ผ๋ฉฐ ์ฌ์ฉ์ ํด๋ฆญ์ ํตํด์๋ง ์ถ์ ๋ฐ ์ธ๊ทธ๋จผํธํํ ํญ๋ชฉ์ ์ง์ ํ ์ ์๋ค. ์ถ์ ํ๋ ๋์ ์ฌ์ฉ์๋ ์ถ์ ํ๋ ค๋ ๊ฐ์ฒด๋ฅผ ์ ์ฐํ๊ฒ ๋ณ๊ฒฝํ๊ฑฐ๋ ๋ชจํธํ ๋ถ๋ถ์ด ์๋ ๊ฒฝ์ฐ ๊ด์ฌ ์์ญ์ ์์ ํ ์๋ ์๋ค. ์ด๋ฌํ ํน์ฑ์ ํตํด Track-Anything์ ๋ค์๊ณผ ๊ฐ์ ์์ .. 2023. 4. 30. [๋ ผ๋ฌธ ์๊ฐ] DINOv2 - Self-supervised Vision Transformer | Meta AI | ๋ ์ด๋ธ ๋ฐ์ดํฐ ์์ด ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ด๋ Vision AI ๋ชจ๋ธ DINOv2 ๋ ผ๋ฌธ ์ ๋ชฉ : DINOv2: Learning Robust Visual Features without Supervision GitHub Demo 23๋ 4์ Meta AI์์ self-supervised learning์ ์ฌ์ฉํ์ฌ ๊ณ ์ฑ๋ฅ ์ปดํจํฐ๋น์ ๋ชจ๋ธ์ ํ์ตํ๋ ์๋ก์ด ๋ฐฉ๋ฒ์ธ DINOv2๋ฅผ ๊ณต๊ฐํ๋ค. LLM(Large Language Model) ํ์ต์๋ ํ์ฉ๋๋ self-supervised learning ๋ฐฉ๋ฒ์ ๋ชจ๋ธ ํ์ต ์ ๋ง์ ์์ ๋ ์ด๋ธ์ด ์ง์ ๋ ๋ฐ์ดํฐ๊ฐ ํ์ํ์ง ์๊ธฐ ๋๋ฌธ์ AI ๋ชจ๋ธ์ ํ์ตํ๋ ๊ฐ๋ ฅํ๊ณ ์ ์ฐํ ๋ฐฉ๋ฒ์ด๋ค. ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด ์ต๊ทผ ๋ช๋ ๋์ ์ปดํจํฐ๋น์ ์์ ์ ํ์ค ์ ๊ทผ ๋ฐฉ์์ด์๋ ์ด๋ฏธ์ง-ํ ์คํธ๋ฅผ ํ์ด๋ก ํ์ตํ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐฉ์์ ํ์ต ๋ฐฉ๋ฒ์์๋ ์ด๋ฏธ์ง์ ์บก์ ์ ๋ณด์ ์์กดํ.. 2023. 4. 29. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers ๋ณธ ๋ ผ๋ฌธ์ NeurIPS 2021 ์ ๊ณต๊ฐ๋์๊ณ , ์ฌํํ๊ณ ๊ฐ๋ ฅํ semantic segmentation task ์ฉ Transformer ์ธ SegFormer ๋ฅผ ์ ์ํ๋ ๋ ผ๋ฌธ์ ๋๋ค. Abstract ๋ณธ ๋ ผ๋ฌธ์์๋ ํจ์จ์ ์ธ Segmentation task ์ํ์ ์ํ ๊ฐ๋จํ๊ณ ํจ์จ์ ์ด๋ฉด์ ๊ฐ๋ ฅํ semantic segmentation ํ๋ ์์ํฌ์ธ SegFormer ๋ฅผ ์ ์ํฉ๋๋ค. SegFormer ๋ 1) multi-scale feature ๋ฅผ ์ถ์ถํ๋ ์๋ก์ด hierarchically structured Transformer encoder ๋ก ๊ตฌ์ฑ๋๊ณ , positional encoding์ด ํ์ํ์ง ์๊ธฐ ๋๋ฌธ์ ํ ์คํธ ์ด๋ฏธ์ง์ ํด์๋๊ฐ ํ์ต ์ด๋ฏธ์ง์ ํด์๋์ ๋ค๋ฅผ ๋ ์ฑ๋ฅ์ด ์ ํ๋๋ positiona.. 2022. 8. 9. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Deep Learning for Large-Scale Traffic-Sign Detection and Recognition / ๊ตํต ํ์งํ ๊ฒ์ถ ๋ณธ ํฌ์คํ ์์๋ Traffic sign detection (๊ตํต ํ์งํ ๊ฐ์ง) ์ ๋ํ ๋ ผ๋ฌธ 2๊ฐ๋ฅผ ์๊ฐํฉ๋๋ค. Traffic-Sign Detection and Classification in the Wild / CVPR 2016 Deep Learning for Large-Scale Traffic-Sign Detection and Recognition / IEEE T-ITS 2019 Traffic sign detection ์ object detection์ ํ์ task๋ก ๋ณผ ์ ์๊ณ , ์์จ ์ฃผํ ๋ฐ ๋๋ก ์ ๋ณด๋ฅผ ์์ฑํ๋๋ฐ ํ์์ ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ๊ต์ฅํ ์์ ๊ฐ์ฒด๋ฅผ ๊ฐ์งํ๋ ๋ฐฉ๋ฒ๋ค์ด ๊ถ๊ธํ์๋๋ฐ, traffic sign detection ๋ ผ๋ฌธ๋ค์ด ๋์์ด ๋๋ ๊ฒ ๊ฐ์ต๋๋ค. "Traffic-Sign De.. 2022. 7. 8. ์ด์ 1 2 3 ๋ค์ 728x90