728x90 ๐ Research58 [NLP] BERT ๊ฐ๋จ ์ค๋ช | Bi-Directional LM | ์๋ฐฉํฅ ์ธ์ด ๋ชจ๋ธ BERT(Bidirectional Encoder Representations from Transformers) BERT๋ ์์ฐ์ด ์ฒ๋ฆฌ (NLP) ๋ถ์ผ์์ ํ์ ์ ์ธ ๋ชจ๋ธ ์ค ํ๋๋ก, ๊ตฌ๊ธ์ด ๊ฐ๋ฐํด 2018๋ ์ ๊ณต๊ฐ๋์๋ค. BERT๋ ์ด์ ์ NLP ๋ชจ๋ธ๋ณด๋ค ๋ ํ์ํ ์ฑ๋ฅ์ ์ ๊ณตํ์ฌ ๋ค์ํ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์์ ์์ ์ฑ๊ณผ๋ฅผ ์ด๋ฃจ์ด ๋๋ค. ์ด ๋ชจ๋ธ์ ํนํ ์ฌ์ ํ๋ จ๋ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๋ค๋ฅธ NLP ์์ ์ ์ ์ฉํ ์ ์๋ ๋ค๋ชฉ์ ๋ชจ๋ธ๋ก ์ฃผ๋ชฉ๋ฐ์๋ค. ๋ ผ๋ฌธ ์ ๋ชฉ์ ์๋์ ๊ฐ์ผ๋ฉฐ ํผ์ธ์ฉ์๋ ์ฝ 8๋งํ(23๋ 9์ ๊ธฐ์ค)๋ก ์ด์ ๋ LM ๋ถ์ผ์์ ์ ๋ง ๊ธฐ๋ณธ์ด ๋๋ ์ฐ๊ตฌ๋ผ๊ณ ํ ์ ์๋ค. paper : BERT: Pre-training of Deep Bidirectional Transformers for Languag.. 2023. 9. 25. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] NeRF ๊ฐ๋จ ์ค๋ช & ์๋ฆฌ ์ดํดํ๊ธฐ | ์๋ก์ด ๋ฐฉํฅ์์ ๋ฐ๋ผ๋ณธ view๋ฅผ ์์ฑํ๋ ๊ธฐ์ - paper : NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis / ECCV2020 NeRF ๋ ผ๋ฌธ์ด ๊ณต๊ฐ๋์ง๋ ์๊ฐ์ด ๊ฝค ํ๋ ๋๋ฐ, 2020 ECCV์์ ๊ณต๊ฐ๋์ ๋๋ง ํด๋ ๊ต์ฅํ ์ ๊ธฐํ๊ณ ํ๊ธฐ์ ์ธ view synthesis ๋ฐฉ๋ฒ์ผ๋ก ๊ด์ฌ์ ๋ฐ์์ง๋ง, ์ฌ๋ฌ ๋จ์ ๋๋ฌธ์ ์ค์ ์๋น์ค์ ์ ์ฉ๋๊ธฐ๋ ์ฝ์ง ์์๋ค. ํ์ง๋ง, 2023 CVPR์์๋ 2022๋ ์ ๋นํด radiance๋ผ๋ ๋จ์ด์ ์ฌ์ฉ์ด 80% ์ฆ๊ฐํ๊ณ , NeRF์ ๊ฒฝ์ฐ 39% ์ฆ๊ฐํ์ ๋งํผ NeRF๋ ํ๋ฐํ ์ฐ๊ตฌ๋๊ณ ์๋ค. ํนํ ์ด์ ๊ฐ๋ ์ฆ๋ช ์ ๋์ด veiw editing ์ด๋ ๊ฐ์ข application ์ฐ๊ตฌ๊ฐ ์งํ๋๊ณ ์๋ค. ์ฆ NeRF๊ฐ ์ด์ ๊ฐ์ข ์๋น์ค์ ํ์ฉ๋ ๋ง.. 2023. 8. 10. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Fast Segment Anything | Fast SAM | SAM์ ๊ฒฝ๋ํ SAM (Segment Anything Model) ์ค๋ช ๋ฐ ์ฌ์ฉ ๋ฐฉ๋ฒ [Meta AI] SAM (Segment Anything Model) ์ฌ์ฉ ๋ฐฉ๋ฒ | ๋ชจ๋ ๊ฐ์ฒด๋ฅผ ๋ถํ ํ๋ Vision AI ๋ชจ๋ธ SAM (Segment Anything Model) Meta ์์ SAM (Segment Anything Model) ์ด๋ผ๋ ์ด๋ค ๊ฒ์ด๋ ๋ถํ ํ ์ ์๋ ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ค. ๋ ผ๋ฌธ ์ ๋ชฉ ์์ฒด๊ฐ 'Segment Anything' ์ธ๋ฐ ๊ต์ฅํ ์์ ๊ฐ ๋์น๋ ์๋ฉ์ด๋ค. ๊ฐ๋จํ ์ค๋ช ์ mvje.tistory.com Meta AI์ Segment Anything Model (SAM)์ด ๊ณต๊ฐ๋์ง ์ผ๋ง๋ ๋๋ค๊ณ ๋ฒ์จ Fast SAM์ด๋ผ๋ ์๋๊ฐ ํฅ์๋ ๋ฒ์ ์ SAM์ด ๊ณต๊ฐ๋์๋ค. ๋น ํ ํฌ ๊ธฐ์ ์์ ํ์ ์ ์ธ AI ๋ชจ๋ธ์ ์ง์์ .. 2023. 7. 2. [๋ ผ๋ฌธ ์๊ฐ] Drag Your GAN - ๋ง์ฐ์ค ๋๋๊ทธ๋ก ์ด๋ฏธ์ง๋ฅผ ์์ฑ/๋ณํํ๋ AI Drag Your GAN ์ด์ ์ ์ ๊ทผ ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ Drag Your GAN์ ์ฌ์ฉ์์ ๋ง์ฐ์ค ๋๋๊ทธ๋ง์ผ๋ก GAN์ ์ ์ดํ๋ค. ๋ ผ๋ฌธ ์ ์๋ ๋๊ตฌ๋ ํฝ์ ์ ์์น๋ฅผ ์ ๋ฐํ๊ฒ ์ ์ดํ์ฌ ์ด๋ฏธ์ง๋ฅผ ๋ณํํ ์ ์์ผ๋ฏ๋ก ๋๋ฌผ, ์๋์ฐจ, ์ธ๊ฐ, ํ๊ฒฝ ๋ฑ๊ณผ ๊ฐ์ ๋ค์ํ ๋ฒ์ฃผ์ ํฌ์ฆ, ๋ชจ์, ํํ ๋ฐ ๋ ์ด์์์ ์กฐ์ํ ์ ์๋ค๊ณ ํ๋ค. ๋ ผ๋ฌธ์ ๊ณต๊ฐ๋ figure๋ฅผ ๋ณด๋ฉด ์ฌ์์ ์ ์ ๋๋๊ทธํ์ฌ ๋ฒ๋ฆฌ๊ฒ ํ๊ฑฐ๋ ๋ค๋ฅธ ๊ณณ์ ์์ํ๊ฒ ํ ์ ์๊ณ , ์ฌ๋์ ์์ธ๋ฅผ ๋ฐ๊พธ๊ฑฐ๋ ํ๊ฒฝ ์ ์ฐ์ ๋์ด๋ฅผ ๋ฐ๊ฟ ์๋ ์๋ค. ๋ฌผ๋ก ๊ฝค๋ ์์ฐ์ค๋ฝ๊ฒ ๋ง์ด๋ค. GAN ๋ถ์ผ์์ ์ด๋ฏธ ์ด๋ฏธ์ง ๋งค๋ํด๋๋ฅผ ํ์ตํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์์ฑ/๋ณํํ๋ ์ฐ๊ตฌ๋ ๋ง์์ง๋ง ์ด๋ ๊ฒ ๋ญ๊ฐ ํ๋ก๋ํธํ(?)๋์ด ๊ณต๊ฐ๋ ๋ ผ๋ฌธ์ ์ฒ์ ๋ณด๋ ๊ฒ ๊ฐ๋ค. Motion supervision ๋จ๊ณ๋ .. 2023. 5. 28. [๋ ผ๋ฌธ ์๊ฐ] TAM (Track Anything Model) | ์ด๋ค ๊ฒ์ด๋ ์ถ์ ํ๋ Vision AI ๋ชจ๋ธ | Sagment Anything ๋น๋์ค ๋ฒ์ Track Anything: Segment Anything Meets Videos ์ธ์ ์ฐธ ๋น ๋ฅด๋ค. Meta AI์ SAM (Segment Anything Model)์ด ๋์จ์ง ์ผ๋ง๋ ๋๋ค๊ณ SAM์ ๋น๋์ค์ ์ ์ฉํด tracking task๋ฅผ ์ํํ๋ TAM (Tracking Anything Model) ๋ ผ๋ฌธ์ด ๋์๋ค๊ณ ํ๋ค. Track-Anything์ ๋น๋์ค ๊ฐ์ฒด ์ถ์ ๋ฐ ๋ถํ ์ ์ํ ์ ์ฐํ ๋ํํ ๋๊ตฌ๋ก Segment Anything์์ ๊ฐ๋ฐ๋์์ผ๋ฉฐ ์ฌ์ฉ์ ํด๋ฆญ์ ํตํด์๋ง ์ถ์ ๋ฐ ์ธ๊ทธ๋จผํธํํ ํญ๋ชฉ์ ์ง์ ํ ์ ์๋ค. ์ถ์ ํ๋ ๋์ ์ฌ์ฉ์๋ ์ถ์ ํ๋ ค๋ ๊ฐ์ฒด๋ฅผ ์ ์ฐํ๊ฒ ๋ณ๊ฒฝํ๊ฑฐ๋ ๋ชจํธํ ๋ถ๋ถ์ด ์๋ ๊ฒฝ์ฐ ๊ด์ฌ ์์ญ์ ์์ ํ ์๋ ์๋ค. ์ด๋ฌํ ํน์ฑ์ ํตํด Track-Anything์ ๋ค์๊ณผ ๊ฐ์ ์์ .. 2023. 4. 30. [๋ ผ๋ฌธ ์๊ฐ] DINOv2 - Self-supervised Vision Transformer | Meta AI | ๋ ์ด๋ธ ๋ฐ์ดํฐ ์์ด ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ด๋ Vision AI ๋ชจ๋ธ DINOv2 ๋ ผ๋ฌธ ์ ๋ชฉ : DINOv2: Learning Robust Visual Features without Supervision GitHub Demo 23๋ 4์ Meta AI์์ self-supervised learning์ ์ฌ์ฉํ์ฌ ๊ณ ์ฑ๋ฅ ์ปดํจํฐ๋น์ ๋ชจ๋ธ์ ํ์ตํ๋ ์๋ก์ด ๋ฐฉ๋ฒ์ธ DINOv2๋ฅผ ๊ณต๊ฐํ๋ค. LLM(Large Language Model) ํ์ต์๋ ํ์ฉ๋๋ self-supervised learning ๋ฐฉ๋ฒ์ ๋ชจ๋ธ ํ์ต ์ ๋ง์ ์์ ๋ ์ด๋ธ์ด ์ง์ ๋ ๋ฐ์ดํฐ๊ฐ ํ์ํ์ง ์๊ธฐ ๋๋ฌธ์ AI ๋ชจ๋ธ์ ํ์ตํ๋ ๊ฐ๋ ฅํ๊ณ ์ ์ฐํ ๋ฐฉ๋ฒ์ด๋ค. ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด ์ต๊ทผ ๋ช๋ ๋์ ์ปดํจํฐ๋น์ ์์ ์ ํ์ค ์ ๊ทผ ๋ฐฉ์์ด์๋ ์ด๋ฏธ์ง-ํ ์คํธ๋ฅผ ํ์ด๋ก ํ์ตํ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐฉ์์ ํ์ต ๋ฐฉ๋ฒ์์๋ ์ด๋ฏธ์ง์ ์บก์ ์ ๋ณด์ ์์กดํ.. 2023. 4. 29. ์ด์ 1 2 3 4 5 6 ยทยทยท 10 ๋ค์ 728x90