728x90 ๐ Research51 VAE (Variational Autoencoder) ์ค๋ช | VAE Pytorch ์ฝ๋ ์์ VAE (Variational Autoencoder) VAE(Variational Autoencoder)๋ ์์ฑ ๋ชจ๋ธ ์ค ํ๋๋ก, ์ฃผ๋ก ์ฐจ์ ์ถ์ ๋ฐ ์์ฑ ์์ ์ ์ฌ์ฉ๋๋ ์ ๊ฒฝ๋ง ์ํคํ ์ฒ์ด๋ค. VAE๋ ๋ฐ์ดํฐ์ ์ ์ฌ ๋ณ์๋ฅผ ํ์ตํ๊ณ ์ด๋ฅผ ์ฌ์ฉํ์ฌ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ฐ ์ฌ์ฉ๋๋๋ฐ, ํนํ ์ด๋ฏธ์ง ๋ฐ ์์ฑ ์์ฑ๊ณผ ๊ฐ์ ์์ฉ ๋ถ์ผ์์ ๋๋ฆฌ ์ฌ์ฉ๋๊ณ ์๋ค. ์ด๋ฌํ VAE๋ ํฌ๊ฒ ์ธ์ฝ๋์ ๋์ฝ๋๋ผ๋ ๋ ๋ถ๋ถ์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ค. Autoencoder(์คํ ์ธ์ฝ๋)์ ํท๊ฐ๋ฆด ์ ์๋๋ฐ, ์คํ ์ธ์ฝ๋๋ ์ธํ์ ๋๊ฐ์ด ๋ณต์ํ ์ ์๋ latent variable z๋ฅผ ๋ง๋๋ ๊ฒ์ด ๋ชฉ์ , ์ฆ ์ธ์ฝ๋๋ฅผ ํ์ตํ๋ ๊ฒ์ด ์ฃผ ๋ชฉ์ ์ด๊ณ , VAE์ ๊ฒฝ์ฐ ์ธํ x๋ฅผ ์ ํํํ๋ latent vector๋ฅผ ์ถ์ถํ๊ณ , ์ด๋ฅผ ํตํด ์ธํ .. 2024. 1. 6. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] End-to-End Object Detection with Transformers | DETR ์ค๋ช ์ค๋์ 2020๋ ์ Meta์์ ๊ณต๊ฐํ DETR ๋ชจ๋ธ(ECCV 2020)์ ๋ฆฌ๋ทฐํด ๋ณด๊ณ ์ ํ๋ค. ํผ ์ธ์ฉ์๊ฐ 9000ํ์ ์ก๋ฐํ๋ฉฐ, ์ต๊ทผ ๊ณต๊ฐ๋๋ ๊ฐ์ฒด ๊ฒ์ถ ๋ ผ๋ฌธ๋ค์ ๋ณด๋ฉด DETR ๊ธฐ๋ฐ์ ์ฐ๊ตฌ๋ ์ฌ์ฌ์น ์๊ฒ ๋ณผ ์ ์๋ค. Deformable DETR, Conditional DETR, Group DETR, Co-DETR, ... DETR (DEtection TRansformer) DETR์ ํธ๋์คํฌ๋จธ์ ์ด๋ถ ๋งค์นญ(Bipartite-matching) ๊ธฐ๋ฐ์ ์๋ก์ด ๊ฒ์ถ ๋ฐฉ์์ ๋์ ํ์ฌ RPN, NMS์ ๊ฐ์ hand-crafted ํ ์์ง๋์ด๋ง์ด ํ์์๋ ๋ชจ๋ธ ๊ตฌ์กฐ๋ผ๊ณ ํ๋ค. ๊ตฌ์กฐ์ ์ผ๋ก ๊ต์ฅํ ๊ฐ๋จํ๋ฉด์ ๋ค๋ฅธ task์ ๋ํ ํ์ฅ์ฑ๋ ์ข๊ณ , ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์ด์ฉํ๊ธฐ ๋๋ฌธ์ ํฐ ๊ฐ์ฒด๋ฅผ ๊ฒ์ถ ๋ฅ๋ ฅ์ด Faste.. 2023. 11. 25. [NLP] BERT ๊ฐ๋จ ์ค๋ช | Bi-Directional LM | ์๋ฐฉํฅ ์ธ์ด ๋ชจ๋ธ BERT(Bidirectional Encoder Representations from Transformers) BERT๋ ์์ฐ์ด ์ฒ๋ฆฌ (NLP) ๋ถ์ผ์์ ํ์ ์ ์ธ ๋ชจ๋ธ ์ค ํ๋๋ก, ๊ตฌ๊ธ์ด ๊ฐ๋ฐํด 2018๋ ์ ๊ณต๊ฐ๋์๋ค. BERT๋ ์ด์ ์ NLP ๋ชจ๋ธ๋ณด๋ค ๋ ํ์ํ ์ฑ๋ฅ์ ์ ๊ณตํ์ฌ ๋ค์ํ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์์ ์์ ์ฑ๊ณผ๋ฅผ ์ด๋ฃจ์ด ๋๋ค. ์ด ๋ชจ๋ธ์ ํนํ ์ฌ์ ํ๋ จ๋ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๋ค๋ฅธ NLP ์์ ์ ์ ์ฉํ ์ ์๋ ๋ค๋ชฉ์ ๋ชจ๋ธ๋ก ์ฃผ๋ชฉ๋ฐ์๋ค. ๋ ผ๋ฌธ ์ ๋ชฉ์ ์๋์ ๊ฐ์ผ๋ฉฐ ํผ์ธ์ฉ์๋ ์ฝ 8๋งํ(23๋ 9์ ๊ธฐ์ค)๋ก ์ด์ ๋ LM ๋ถ์ผ์์ ์ ๋ง ๊ธฐ๋ณธ์ด ๋๋ ์ฐ๊ตฌ๋ผ๊ณ ํ ์ ์๋ค. paper : BERT: Pre-training of Deep Bidirectional Transformers for Languag.. 2023. 9. 25. [ํํ ๋ฆฌ์ผ] ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์ฝ๋ ์๊ฐ | Image Classification | Pytorch Image Classification(์ด๋ฏธ์ง ๋ถ๋ฅ)์ ์ปดํจํฐ๋น์ ๊ณผ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ๊ฐ์ฅ ๊ฐ๋จํ ์์ ์ค ํ๋๋ก, ํํ MNIST ๋ฐ์ดํฐ์ ์ ์ด์ฉํ ์ซ์ ๋ถ๋ฅ๊ธฐ๋ Cifar-10 ๊ฐ์ ์๊ท๋ชจ ๋ฐ์ดํฐ์ ์ ํ์ตํ๋ ์์ ๊ฐ ๋ง์ด ๊ณต๊ฐ๋์ด ์๋ค. ์ด๋ฏธ์ง ๋ถ๋ฅ์ ๊ฒฝ์ฐ ์์ฃผ ๋ณต์กํ ์์ ์ด ์๋ ๊ฒฝ์ฐ ResNet ์ ๋๋ก๋ง ํ์ตํด๋ ๊ฝค ์ค์ํ ์ฑ๋ฅ์ ๋ผ ์ ์๊ธฐ์ ํ์ต & ํ๊ฐ ์ฝ๋๋ฅผ ๊ตฌ์ถํด๋๊ณ ๋ฐ์ดํฐ์ ๊ณผ ๋ชจ๋ธ๋ง ๋ณ๊ฒฝํด๊ฐ๋ฉฐ ์ฌ์ฉํ๋ ๊ฒ์ด ํธ๋ฆฌํ๋ค. *๋ณต์กํ task์ ๊ฒฝ์ฐ ๋ณธ์ธ์ด ์ฌ์ฉ์ค์ธ ํ์ต&ํ๊ฐ ์ฝ๋์ ์๋ก์ด ๋ชจ๋ธ์ ์ด์ํ๋ ๊ฒ์ด ์ฝ์ง ์๋ค. ๋๋ถ๋ถ ์ด๋ฐ ๊ฒฝ์ฐ์๋ ํด๋น ๋ ผ๋ฌธ(์ฐ๊ตฌ)์ ์ ์๊ฐ ์ ๊ณตํ๋ ๊ณต์ ๋ ํฌ์งํ ๋ฆฌ๋ฅผ ๊ทธ๋๋ก ์ฌ์ฉํ๋ ๊ฒ์ด ํธํ๋ค. ์ด๋ฏธ์ง ๋ถ๋ฅ ํ์ต ๋ฐ ํ๊ฐ ์ฝ๋์ ์์ฑ์ ์ฐธ๊ณ ํ ๋งํ ์ฌ์ดํธ์ ๋ ํฌ์งํ .. 2023. 8. 11. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] NeRF ๊ฐ๋จ ์ค๋ช & ์๋ฆฌ ์ดํดํ๊ธฐ | ์๋ก์ด ๋ฐฉํฅ์์ ๋ฐ๋ผ๋ณธ view๋ฅผ ์์ฑํ๋ ๊ธฐ์ - paper : NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis / ECCV2020 NeRF ๋ ผ๋ฌธ์ด ๊ณต๊ฐ๋์ง๋ ์๊ฐ์ด ๊ฝค ํ๋ ๋๋ฐ, 2020 ECCV์์ ๊ณต๊ฐ๋์ ๋๋ง ํด๋ ๊ต์ฅํ ์ ๊ธฐํ๊ณ ํ๊ธฐ์ ์ธ view synthesis ๋ฐฉ๋ฒ์ผ๋ก ๊ด์ฌ์ ๋ฐ์์ง๋ง, ์ฌ๋ฌ ๋จ์ ๋๋ฌธ์ ์ค์ ์๋น์ค์ ์ ์ฉ๋๊ธฐ๋ ์ฝ์ง ์์๋ค. ํ์ง๋ง, 2023 CVPR์์๋ 2022๋ ์ ๋นํด radiance๋ผ๋ ๋จ์ด์ ์ฌ์ฉ์ด 80% ์ฆ๊ฐํ๊ณ , NeRF์ ๊ฒฝ์ฐ 39% ์ฆ๊ฐํ์ ๋งํผ NeRF๋ ํ๋ฐํ ์ฐ๊ตฌ๋๊ณ ์๋ค. ํนํ ์ด์ ๊ฐ๋ ์ฆ๋ช ์ ๋์ด veiw editing ์ด๋ ๊ฐ์ข application ์ฐ๊ตฌ๊ฐ ์งํ๋๊ณ ์๋ค. ์ฆ NeRF๊ฐ ์ด์ ๊ฐ์ข ์๋น์ค์ ํ์ฉ๋ ๋ง.. 2023. 8. 10. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Fast Segment Anything | Fast SAM | SAM์ ๊ฒฝ๋ํ SAM (Segment Anything Model) ์ค๋ช ๋ฐ ์ฌ์ฉ ๋ฐฉ๋ฒ [Meta AI] SAM (Segment Anything Model) ์ฌ์ฉ ๋ฐฉ๋ฒ | ๋ชจ๋ ๊ฐ์ฒด๋ฅผ ๋ถํ ํ๋ Vision AI ๋ชจ๋ธ SAM (Segment Anything Model) Meta ์์ SAM (Segment Anything Model) ์ด๋ผ๋ ์ด๋ค ๊ฒ์ด๋ ๋ถํ ํ ์ ์๋ ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ค. ๋ ผ๋ฌธ ์ ๋ชฉ ์์ฒด๊ฐ 'Segment Anything' ์ธ๋ฐ ๊ต์ฅํ ์์ ๊ฐ ๋์น๋ ์๋ฉ์ด๋ค. ๊ฐ๋จํ ์ค๋ช ์ mvje.tistory.com Meta AI์ Segment Anything Model (SAM)์ด ๊ณต๊ฐ๋์ง ์ผ๋ง๋ ๋๋ค๊ณ ๋ฒ์จ Fast SAM์ด๋ผ๋ ์๋๊ฐ ํฅ์๋ ๋ฒ์ ์ SAM์ด ๊ณต๊ฐ๋์๋ค. ๋น ํ ํฌ ๊ธฐ์ ์์ ํ์ ์ ์ธ AI ๋ชจ๋ธ์ ์ง์์ .. 2023. 7. 2. ์ด์ 1 2 3 4 ยทยทยท 9 ๋ค์ 728x90