๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
728x90

๐Ÿ› Research51

[๋…ผ๋ฌธ ์†Œ๊ฐœ] Drag Your GAN - ๋งˆ์šฐ์Šค ๋“œ๋ž˜๊ทธ๋กœ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑ/๋ณ€ํ˜•ํ•˜๋Š” AI Drag Your GAN ์ด์ „์˜ ์ ‘๊ทผ ๋ฐฉ์‹๊ณผ ๋‹ฌ๋ฆฌ Drag Your GAN์€ ์‚ฌ์šฉ์ž์˜ ๋งˆ์šฐ์Šค ๋“œ๋ž˜๊ทธ๋งŒ์œผ๋กœ GAN์„ ์ œ์–ดํ•œ๋‹ค. ๋…ผ๋ฌธ ์ €์ž๋Š” ๋ˆ„๊ตฌ๋‚˜ ํ”ฝ์…€์˜ ์œ„์น˜๋ฅผ ์ •๋ฐ€ํ•˜๊ฒŒ ์ œ์–ดํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ๋ณ€ํ˜•ํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ๋™๋ฌผ, ์ž๋™์ฐจ, ์ธ๊ฐ„, ํ’๊ฒฝ ๋“ฑ๊ณผ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ๋ฒ”์ฃผ์˜ ํฌ์ฆˆ, ๋ชจ์–‘, ํ‘œํ˜„ ๋ฐ ๋ ˆ์ด์•„์›ƒ์„ ์กฐ์ž‘ํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•œ๋‹ค. ๋…ผ๋ฌธ์— ๊ณต๊ฐœ๋œ figure๋ฅผ ๋ณด๋ฉด ์‚ฌ์ž์˜ ์ž…์„ ๋“œ๋ž˜๊ทธํ•˜์—ฌ ๋ฒŒ๋ฆฌ๊ฒŒ ํ•˜๊ฑฐ๋‚˜ ๋‹ค๋ฅธ ๊ณณ์„ ์‘์‹œํ•˜๊ฒŒ ํ• ์ˆ˜ ์žˆ๊ณ , ์‚ฌ๋žŒ์˜ ์ž์„ธ๋ฅผ ๋ฐ”๊พธ๊ฑฐ๋‚˜ ํ’๊ฒฝ ์† ์‚ฐ์˜ ๋†’์ด๋ฅผ ๋ฐ”๊ฟ€ ์ˆ˜๋„ ์žˆ๋‹ค. ๋ฌผ๋ก  ๊ฝค๋‚˜ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ง์ด๋‹ค. GAN ๋ถ„์•ผ์—์„œ ์ด๋ฏธ ์ด๋ฏธ์ง€ ๋งค๋‹ˆํด๋“œ๋ฅผ ํ•™์Šตํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑ/๋ณ€ํ˜•ํ•˜๋Š” ์—ฐ๊ตฌ๋Š” ๋งŽ์•˜์ง€๋งŒ ์ด๋ ‡๊ฒŒ ๋ญ”๊ฐ€ ํ”„๋กœ๋•ํŠธํ™”(?)๋˜์–ด ๊ณต๊ฐœ๋œ ๋…ผ๋ฌธ์€ ์ฒ˜์Œ ๋ณด๋Š” ๊ฒƒ ๊ฐ™๋‹ค. Motion supervision ๋‹จ๊ณ„๋Š” .. 2023. 5. 28.
[๋…ผ๋ฌธ ์†Œ๊ฐœ] TAM (Track Anything Model) | ์–ด๋–ค ๊ฒƒ์ด๋“  ์ถ”์ ํ•˜๋Š” Vision AI ๋ชจ๋ธ | Sagment Anything ๋น„๋””์˜ค ๋ฒ„์ „ Track Anything: Segment Anything Meets Videos ์„ธ์ƒ ์ฐธ ๋น ๋ฅด๋‹ค. Meta AI์˜ SAM (Segment Anything Model)์ด ๋‚˜์˜จ์ง€ ์–ผ๋งˆ๋‚˜ ๋๋‹ค๊ณ  SAM์„ ๋น„๋””์˜ค์— ์ ์šฉํ•ด tracking task๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” TAM (Tracking Anything Model) ๋…ผ๋ฌธ์ด ๋‚˜์™”๋‹ค๊ณ  ํ•œ๋‹ค. Track-Anything์€ ๋น„๋””์˜ค ๊ฐ์ฒด ์ถ”์  ๋ฐ ๋ถ„ํ• ์„ ์œ„ํ•œ ์œ ์—ฐํ•œ ๋Œ€ํ™”ํ˜• ๋„๊ตฌ๋กœ Segment Anything์—์„œ ๊ฐœ๋ฐœ๋˜์—ˆ์œผ๋ฉฐ ์‚ฌ์šฉ์ž ํด๋ฆญ์„ ํ†ตํ•ด์„œ๋งŒ ์ถ”์  ๋ฐ ์„ธ๊ทธ๋จผํŠธํ™”ํ•  ํ•ญ๋ชฉ์„ ์ง€์ •ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ถ”์ ํ•˜๋Š” ๋™์•ˆ ์‚ฌ์šฉ์ž๋Š” ์ถ”์ ํ•˜๋ ค๋Š” ๊ฐœ์ฒด๋ฅผ ์œ ์—ฐํ•˜๊ฒŒ ๋ณ€๊ฒฝํ•˜๊ฑฐ๋‚˜ ๋ชจํ˜ธํ•œ ๋ถ€๋ถ„์ด ์žˆ๋Š” ๊ฒฝ์šฐ ๊ด€์‹ฌ ์˜์—ญ์„ ์ˆ˜์ •ํ•  ์ˆ˜๋„ ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ํŠน์„ฑ์„ ํ†ตํ•ด Track-Anything์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ž‘์—….. 2023. 4. 30.
[๋…ผ๋ฌธ ์†Œ๊ฐœ] DINOv2 - Self-supervised Vision Transformer | Meta AI | ๋ ˆ์ด๋ธ” ๋ฐ์ดํ„ฐ ์—†์ด ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” Vision AI ๋ชจ๋ธ DINOv2 ๋…ผ๋ฌธ ์ œ๋ชฉ : DINOv2: Learning Robust Visual Features without Supervision GitHub Demo 23๋…„ 4์›” Meta AI์—์„œ self-supervised learning์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ณ ์„ฑ๋Šฅ ์ปดํ“จํ„ฐ๋น„์ „ ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•์ธ DINOv2๋ฅผ ๊ณต๊ฐœํ–ˆ๋‹ค. LLM(Large Language Model) ํ•™์Šต์—๋„ ํ™œ์šฉ๋˜๋Š” self-supervised learning ๋ฐฉ๋ฒ•์€ ๋ชจ๋ธ ํ•™์Šต ์‹œ ๋งŽ์€ ์–‘์˜ ๋ ˆ์ด๋ธ”์ด ์ง€์ •๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— AI ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๋Š” ๊ฐ•๋ ฅํ•˜๊ณ  ์œ ์—ฐํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค. ๋…ผ๋ฌธ์— ๋”ฐ๋ฅด๋ฉด ์ตœ๊ทผ ๋ช‡๋…„ ๋™์•ˆ ์ปดํ“จํ„ฐ๋น„์ „ ์ž‘์—…์˜ ํ‘œ์ค€ ์ ‘๊ทผ ๋ฐฉ์‹์ด์—ˆ๋˜ ์ด๋ฏธ์ง€-ํ…์ŠคํŠธ๋ฅผ ํŽ˜์–ด๋กœ ํ•™์Šตํ•˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐฉ์‹์˜ ํ•™์Šต ๋ฐฉ๋ฒ•์—์„œ๋Š” ์ด๋ฏธ์ง€์˜ ์บก์…˜ ์ •๋ณด์— ์˜์กดํ•œ.. 2023. 4. 29.
[์˜คํ”ˆ์†Œ์Šค] OpenMMLab ์ปดํ“จํ„ฐ๋น„์ „ ์˜คํ”ˆ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ | ๋‹ค์–‘ํ•œ ์ปดํ“จํ„ฐ๋น„์ „ ์—ฐ๊ตฌ ์ฃผ์ œ OpenMMLab OpenMMLab์€ ํ•™์ˆ  ์—ฐ๊ตฌ ๋ฐ ์‚ฐ์—… ์‘์šฉ์„ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์ปดํ“จํ„ฐ๋น„์ „ ์˜คํ”ˆ์†Œ์Šค ํ”„๋กœ์ ํŠธ๋“ค์„ ์ œ๊ณตํ•œ๋‹ค. OpenMMLab์—์„œ๋Š” ์•„๋ž˜์™€ ๊ฐ™์€ ์žฅ์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๊ณ  ์„ค๋ช…ํ•˜๋Š”๋ฐ, ๊ต‰์žฅํžˆ ๋งŽ์€ ํ”„๋กœ์ ํŠธ์™€ ํˆด์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋‚ด๊ฐ€ ์จ๋ณธ ๊ฒƒ์€ ๊ทนํžˆ ์ผ๋ถ€์ด์ง€๋งŒ ํ•„์š”ํ•œ ๊ธฐ๋Šฅ๋“ค์„ ํŽธ๋ฆฌํ•˜๊ฒŒ ์ž˜ ๊ตฌํ˜„ํ–ˆ๋‹ค๋Š” ๋Š๋‚Œ์„ ๋ฐ›์•˜์—ˆ๋‹ค. ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์žฌ๊ตฌํ˜„์˜ ์–ด๋ ค์›€์„ ์ค„์ด๊ธฐ ์œ„ํ•œ ๊ณ ํ’ˆ์งˆ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ œ๊ณต ๋‹ค์–‘ํ•œ ๋ฐฑ์—”๋“œ ๋ฐ ์žฅ์น˜๋ฅผ ๋Œ€์ƒ์œผ๋กœ ํ•˜๋Š” ํšจ์œจ์ ์ธ ๋ฐฐํฌ ๋„๊ตฌ ์ œ๊ณต ์ปดํ“จํ„ฐ๋น„์ „ ์—ฐ๊ตฌ ๋ฐ ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ๊ฒฌ๊ณ ํ•œ ๊ธฐ๋ฐ˜ ๊ตฌ์ถ• ํ’€์Šคํƒ ํˆด์ฒด์ธ์œผ๋กœ ํ•™์ˆ  ์—ฐ๊ตฌ์™€ ์‚ฐ์—… ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ ๊ฐ„์˜ ๊ฒฉ์ฐจ ํ•ด์†Œ ๊ฐœ์ธ์ ์œผ๋กœ๋Š” Pytorch ๊ธฐ๋ฐ˜์ด๋ผ ์ข‹์•˜๋‹ค... OpenMMLab์€ ๊ต‰์žฅํžˆ ๋‹ค์–‘ํ•œ ์ปดํ“จํ„ฐ๋น„์ „ ์—ฐ๊ตฌ ์ฃผ์ œ์—์„œ ์ตœ์‹  ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๊ณผ ๊ณ ์„ฑ๋Šฅ ์ฝ”๋“œ๋ฅผ ์ œ๊ณตํ•˜๊ธฐ.. 2023. 4. 16.
[๊ธฐ์ˆ  ์†Œ๊ฐœ] 3D Object Scanning | MVS | ๊ฐ์ฒด ์Šค์บ๋‹ | ์‹ค์‹œ๊ฐ„ 3D ๊ฐ์ฒด ๋ณต์› 3D Object Scanning 3D Object Scanning์€ multi-view stereo (MVS) ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์—ฌ ๊ฐ์ฒด์˜ 3D shape์„ ๋ณต์›ํ•˜๋Š” ๊ธฐ์ˆ ์ด๋‹ค. ์•„๋ž˜ ์˜์ƒ์„ ๋ณด๋ฉด Niantic์ด๋ผ๋Š” ๊ธฐ์—…์—์„œ Unity SDK์— ๋น ๋ฅธ non-lidar ์Šค์บ” ํˆด์„ ์ถ”๊ฐ€ํ•˜์—ฌ ์‚ฌ์šฉ์ž๊ฐ€ ๊ฐ์ฒด๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์Šค์บ”ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค. ์Šค๋งˆํŠธํฐ์œผ๋กœ ๊ฐ์ฒด๋ฅผ ๋‹ค์–‘ํ•œ ๊ฐ๋„์—์„œ ์ดฌ์˜ํ•˜๊ณ  ๊ฐ์ฒด๋ฅผ ๋ณต์›ํ•˜๋Š”๋ฐ ํ’ˆ์งˆ์ด ๊ฝค ์ข‹์•„๋ณด์ธ๋‹ค. ๋˜ํ•œ RealityScan๊ณผ ๊ฐ™์€ ์•ฑ์„ ์‚ฌ์šฉํ•˜๋ฉด ์Šค๋งˆํŠธํฐ์œผ๋กœ ๊ฐ„๋‹จํ•˜๊ฒŒ 3D ์Šค์บ”์„ ๊ฒฝํ—˜ํ•ด ๋ณผ ์ˆ˜๋„ ์žˆ๋‹ค. Niantic ๊ธฐ์—…์˜ Object Scanning ์˜ˆ์‹œ RealityScan - 3D Scanning App์˜ ๊ฒฐ๊ณผ ์˜ˆ์‹œ ์ถœ์ฒ˜ : https://sketchfab.com/3d-models.. 2023. 4. 7.
[๊ธฐ์ˆ  ์†Œ๊ฐœ] Text-to-Image Generation | ์ด๋ฏธ์ง€ ์ƒ์„ฑ AI | DALL-E | GPT | dVAE Text to Image Generation Text to Image generation์€ ํ…์ŠคํŠธ ์ •๋ณด๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„์„œ ํ•ด๋‹น ํ…์ŠคํŠธ์— ํ•ด๋‹นํ•˜๋Š” ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ธฐ์ˆ ์ด๋‹ค. ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์œผ๋กœ ์ธํ•ด 2010๋…„๋Œ€ ์ค‘๋ฐ˜๋ถ€ํ„ฐ ๊ฐœ๋ฐœ๋˜๊ธฐ ์‹œ์ž‘ํ•ด 2022๋…„์—๋Š” OpenAI์˜ DALL-E 2 , Google Brain์˜ Imagen , StabilityAI์˜ Stable Diffusion ๊ณผ ๊ฐ™์€ ์ตœ์ฒจ๋‹จ ํ…์ŠคํŠธ-์ด๋ฏธ์ง€ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ๋ฌผ์ด ์‹ค์ œ ์‚ฌ์ง„๊ณผ ์‚ฌ๋žŒ์ด ๊ทธ๋ฆฐ ์˜ˆ์ˆ ํ’ˆ์˜ ํ’ˆ์งˆ์— ์ ‘๊ทผํ•˜๊ธฐ ์‹œ์ž‘ํ–ˆ๋‹ค. Text to Image generation์—์„œ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์ด๋Ÿฌํ•œ GAN(Generative Adversarial Networks) ๋ชจ๋ธ์„ ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€๋ฅผ ์Œ์œผ๋กœ ์ด๋ฃจ๋Š” ๋ฐ์ดํ„ฐ์…‹์„ ํ•™์Šต์‹œ์ผœ์„œ ๊ตฌํ˜„ํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ".. 2023. 4. 6.
728x90