728x90 ๐ Research51 [๋ ผ๋ฌธ ์๊ฐ] Drag Your GAN - ๋ง์ฐ์ค ๋๋๊ทธ๋ก ์ด๋ฏธ์ง๋ฅผ ์์ฑ/๋ณํํ๋ AI Drag Your GAN ์ด์ ์ ์ ๊ทผ ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ Drag Your GAN์ ์ฌ์ฉ์์ ๋ง์ฐ์ค ๋๋๊ทธ๋ง์ผ๋ก GAN์ ์ ์ดํ๋ค. ๋ ผ๋ฌธ ์ ์๋ ๋๊ตฌ๋ ํฝ์ ์ ์์น๋ฅผ ์ ๋ฐํ๊ฒ ์ ์ดํ์ฌ ์ด๋ฏธ์ง๋ฅผ ๋ณํํ ์ ์์ผ๋ฏ๋ก ๋๋ฌผ, ์๋์ฐจ, ์ธ๊ฐ, ํ๊ฒฝ ๋ฑ๊ณผ ๊ฐ์ ๋ค์ํ ๋ฒ์ฃผ์ ํฌ์ฆ, ๋ชจ์, ํํ ๋ฐ ๋ ์ด์์์ ์กฐ์ํ ์ ์๋ค๊ณ ํ๋ค. ๋ ผ๋ฌธ์ ๊ณต๊ฐ๋ figure๋ฅผ ๋ณด๋ฉด ์ฌ์์ ์ ์ ๋๋๊ทธํ์ฌ ๋ฒ๋ฆฌ๊ฒ ํ๊ฑฐ๋ ๋ค๋ฅธ ๊ณณ์ ์์ํ๊ฒ ํ ์ ์๊ณ , ์ฌ๋์ ์์ธ๋ฅผ ๋ฐ๊พธ๊ฑฐ๋ ํ๊ฒฝ ์ ์ฐ์ ๋์ด๋ฅผ ๋ฐ๊ฟ ์๋ ์๋ค. ๋ฌผ๋ก ๊ฝค๋ ์์ฐ์ค๋ฝ๊ฒ ๋ง์ด๋ค. GAN ๋ถ์ผ์์ ์ด๋ฏธ ์ด๋ฏธ์ง ๋งค๋ํด๋๋ฅผ ํ์ตํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์์ฑ/๋ณํํ๋ ์ฐ๊ตฌ๋ ๋ง์์ง๋ง ์ด๋ ๊ฒ ๋ญ๊ฐ ํ๋ก๋ํธํ(?)๋์ด ๊ณต๊ฐ๋ ๋ ผ๋ฌธ์ ์ฒ์ ๋ณด๋ ๊ฒ ๊ฐ๋ค. Motion supervision ๋จ๊ณ๋ .. 2023. 5. 28. [๋ ผ๋ฌธ ์๊ฐ] TAM (Track Anything Model) | ์ด๋ค ๊ฒ์ด๋ ์ถ์ ํ๋ Vision AI ๋ชจ๋ธ | Sagment Anything ๋น๋์ค ๋ฒ์ Track Anything: Segment Anything Meets Videos ์ธ์ ์ฐธ ๋น ๋ฅด๋ค. Meta AI์ SAM (Segment Anything Model)์ด ๋์จ์ง ์ผ๋ง๋ ๋๋ค๊ณ SAM์ ๋น๋์ค์ ์ ์ฉํด tracking task๋ฅผ ์ํํ๋ TAM (Tracking Anything Model) ๋ ผ๋ฌธ์ด ๋์๋ค๊ณ ํ๋ค. Track-Anything์ ๋น๋์ค ๊ฐ์ฒด ์ถ์ ๋ฐ ๋ถํ ์ ์ํ ์ ์ฐํ ๋ํํ ๋๊ตฌ๋ก Segment Anything์์ ๊ฐ๋ฐ๋์์ผ๋ฉฐ ์ฌ์ฉ์ ํด๋ฆญ์ ํตํด์๋ง ์ถ์ ๋ฐ ์ธ๊ทธ๋จผํธํํ ํญ๋ชฉ์ ์ง์ ํ ์ ์๋ค. ์ถ์ ํ๋ ๋์ ์ฌ์ฉ์๋ ์ถ์ ํ๋ ค๋ ๊ฐ์ฒด๋ฅผ ์ ์ฐํ๊ฒ ๋ณ๊ฒฝํ๊ฑฐ๋ ๋ชจํธํ ๋ถ๋ถ์ด ์๋ ๊ฒฝ์ฐ ๊ด์ฌ ์์ญ์ ์์ ํ ์๋ ์๋ค. ์ด๋ฌํ ํน์ฑ์ ํตํด Track-Anything์ ๋ค์๊ณผ ๊ฐ์ ์์ .. 2023. 4. 30. [๋ ผ๋ฌธ ์๊ฐ] DINOv2 - Self-supervised Vision Transformer | Meta AI | ๋ ์ด๋ธ ๋ฐ์ดํฐ ์์ด ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ด๋ Vision AI ๋ชจ๋ธ DINOv2 ๋ ผ๋ฌธ ์ ๋ชฉ : DINOv2: Learning Robust Visual Features without Supervision GitHub Demo 23๋ 4์ Meta AI์์ self-supervised learning์ ์ฌ์ฉํ์ฌ ๊ณ ์ฑ๋ฅ ์ปดํจํฐ๋น์ ๋ชจ๋ธ์ ํ์ตํ๋ ์๋ก์ด ๋ฐฉ๋ฒ์ธ DINOv2๋ฅผ ๊ณต๊ฐํ๋ค. LLM(Large Language Model) ํ์ต์๋ ํ์ฉ๋๋ self-supervised learning ๋ฐฉ๋ฒ์ ๋ชจ๋ธ ํ์ต ์ ๋ง์ ์์ ๋ ์ด๋ธ์ด ์ง์ ๋ ๋ฐ์ดํฐ๊ฐ ํ์ํ์ง ์๊ธฐ ๋๋ฌธ์ AI ๋ชจ๋ธ์ ํ์ตํ๋ ๊ฐ๋ ฅํ๊ณ ์ ์ฐํ ๋ฐฉ๋ฒ์ด๋ค. ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด ์ต๊ทผ ๋ช๋ ๋์ ์ปดํจํฐ๋น์ ์์ ์ ํ์ค ์ ๊ทผ ๋ฐฉ์์ด์๋ ์ด๋ฏธ์ง-ํ ์คํธ๋ฅผ ํ์ด๋ก ํ์ตํ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐฉ์์ ํ์ต ๋ฐฉ๋ฒ์์๋ ์ด๋ฏธ์ง์ ์บก์ ์ ๋ณด์ ์์กดํ.. 2023. 4. 29. [์คํ์์ค] OpenMMLab ์ปดํจํฐ๋น์ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ | ๋ค์ํ ์ปดํจํฐ๋น์ ์ฐ๊ตฌ ์ฃผ์ OpenMMLab OpenMMLab์ ํ์ ์ฐ๊ตฌ ๋ฐ ์ฐ์ ์์ฉ์ ์ํ ๋ค์ํ ์ปดํจํฐ๋น์ ์คํ์์ค ํ๋ก์ ํธ๋ค์ ์ ๊ณตํ๋ค. OpenMMLab์์๋ ์๋์ ๊ฐ์ ์ฅ์ ์ ๊ฐ์ง๊ณ ์๋ค๊ณ ์ค๋ช ํ๋๋ฐ, ๊ต์ฅํ ๋ง์ ํ๋ก์ ํธ์ ํด์ด ์๊ธฐ ๋๋ฌธ์ ๋ด๊ฐ ์จ๋ณธ ๊ฒ์ ๊ทนํ ์ผ๋ถ์ด์ง๋ง ํ์ํ ๊ธฐ๋ฅ๋ค์ ํธ๋ฆฌํ๊ฒ ์ ๊ตฌํํ๋ค๋ ๋๋์ ๋ฐ์์๋ค. ์๊ณ ๋ฆฌ์ฆ ์ฌ๊ตฌํ์ ์ด๋ ค์์ ์ค์ด๊ธฐ ์ํ ๊ณ ํ์ง ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ๊ณต ๋ค์ํ ๋ฐฑ์๋ ๋ฐ ์ฅ์น๋ฅผ ๋์์ผ๋ก ํ๋ ํจ์จ์ ์ธ ๋ฐฐํฌ ๋๊ตฌ ์ ๊ณต ์ปดํจํฐ๋น์ ์ฐ๊ตฌ ๋ฐ ๊ฐ๋ฐ์ ์ํ ๊ฒฌ๊ณ ํ ๊ธฐ๋ฐ ๊ตฌ์ถ ํ์คํ ํด์ฒด์ธ์ผ๋ก ํ์ ์ฐ๊ตฌ์ ์ฐ์ ์์ฉ ํ๋ก๊ทธ๋จ ๊ฐ์ ๊ฒฉ์ฐจ ํด์ ๊ฐ์ธ์ ์ผ๋ก๋ Pytorch ๊ธฐ๋ฐ์ด๋ผ ์ข์๋ค... OpenMMLab์ ๊ต์ฅํ ๋ค์ํ ์ปดํจํฐ๋น์ ์ฐ๊ตฌ ์ฃผ์ ์์ ์ต์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๊ณผ ๊ณ ์ฑ๋ฅ ์ฝ๋๋ฅผ ์ ๊ณตํ๊ธฐ.. 2023. 4. 16. [๊ธฐ์ ์๊ฐ] 3D Object Scanning | MVS | ๊ฐ์ฒด ์ค์บ๋ | ์ค์๊ฐ 3D ๊ฐ์ฒด ๋ณต์ 3D Object Scanning 3D Object Scanning์ multi-view stereo (MVS) ๊ธฐ์ ์ ํ์ฉํ์ฌ ๊ฐ์ฒด์ 3D shape์ ๋ณต์ํ๋ ๊ธฐ์ ์ด๋ค. ์๋ ์์์ ๋ณด๋ฉด Niantic์ด๋ผ๋ ๊ธฐ์ ์์ Unity SDK์ ๋น ๋ฅธ non-lidar ์ค์บ ํด์ ์ถ๊ฐํ์ฌ ์ฌ์ฉ์๊ฐ ๊ฐ์ฒด๋ฅผ ์ค์๊ฐ์ผ๋ก ์ค์บํ ์ ์๊ฒ ํ๋ค. ์ค๋งํธํฐ์ผ๋ก ๊ฐ์ฒด๋ฅผ ๋ค์ํ ๊ฐ๋์์ ์ดฌ์ํ๊ณ ๊ฐ์ฒด๋ฅผ ๋ณต์ํ๋๋ฐ ํ์ง์ด ๊ฝค ์ข์๋ณด์ธ๋ค. ๋ํ RealityScan๊ณผ ๊ฐ์ ์ฑ์ ์ฌ์ฉํ๋ฉด ์ค๋งํธํฐ์ผ๋ก ๊ฐ๋จํ๊ฒ 3D ์ค์บ์ ๊ฒฝํํด ๋ณผ ์๋ ์๋ค. Niantic ๊ธฐ์ ์ Object Scanning ์์ RealityScan - 3D Scanning App์ ๊ฒฐ๊ณผ ์์ ์ถ์ฒ : https://sketchfab.com/3d-models.. 2023. 4. 7. [๊ธฐ์ ์๊ฐ] Text-to-Image Generation | ์ด๋ฏธ์ง ์์ฑ AI | DALL-E | GPT | dVAE Text to Image Generation Text to Image generation์ ํ ์คํธ ์ ๋ณด๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์์ ํด๋น ํ ์คํธ์ ํด๋นํ๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋ ๊ธฐ์ ์ด๋ค. ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ๋ฐ์ ์ผ๋ก ์ธํด 2010๋ ๋ ์ค๋ฐ๋ถํฐ ๊ฐ๋ฐ๋๊ธฐ ์์ํด 2022๋ ์๋ OpenAI์ DALL-E 2 , Google Brain์ Imagen , StabilityAI์ Stable Diffusion ๊ณผ ๊ฐ์ ์ต์ฒจ๋จ ํ ์คํธ-์ด๋ฏธ์ง ๋ชจ๋ธ์ ์ถ๋ ฅ๋ฌผ์ด ์ค์ ์ฌ์ง๊ณผ ์ฌ๋์ด ๊ทธ๋ฆฐ ์์ ํ์ ํ์ง์ ์ ๊ทผํ๊ธฐ ์์ํ๋ค. Text to Image generation์์๋ ์ผ๋ฐ์ ์ผ๋ก ์ด๋ฌํ GAN(Generative Adversarial Networks) ๋ชจ๋ธ์ ํ ์คํธ์ ์ด๋ฏธ์ง๋ฅผ ์์ผ๋ก ์ด๋ฃจ๋ ๋ฐ์ดํฐ์ ์ ํ์ต์์ผ์ ๊ตฌํํ๋ค. ์๋ฅผ ๋ค์ด, ".. 2023. 4. 6. ์ด์ 1 2 3 4 5 ยทยทยท 9 ๋ค์ 728x90