๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ“– Theory/Computer Vision

Computer Vision (์ปดํ“จํ„ฐ ๋น„์ „) ์ด ๋ฌด์—‡์ผ๊นŒ !?

by ๋ญ…์ฆค 2023. 4. 7.
๋ฐ˜์‘ํ˜•
Computer Vision (์ปดํ“จํ„ฐ ๋น„์ „)

 
์ปดํ“จํ„ฐ ๋น„์ „(Computer Vision)์€ ๋ง ๊ทธ๋Œ€๋กœ ์ปดํ“จํ„ฐ๊ฐ€ '์‹œ๊ฐ'์„ ๊ฐ€์ง€๊ฒŒ ํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์‰ฝ๊ฒŒ ๋งํ•ด, ์šฐ๋ฆฌ๊ฐ€ ๋ˆˆ์œผ๋กœ ์„ธ์ƒ์„ ๋ณด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, ์ปดํ“จํ„ฐ๊ฐ€ ์ด๋ฏธ์ง€๋‚˜ ๋™์˜์ƒ์„ ํ†ตํ•ด ์ฃผ๋ณ€ ํ™˜๊ฒฝ์„ ์ธ์‹ํ•˜๊ณ  ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“œ๋Š” ๊ธฐ์ˆ ์ด์ฃ . ์˜ˆ์ „์—๋Š” ๋‹จ์ˆœํžˆ ์นด๋ฉ”๋ผ๋กœ ์ฐ์€ ์‚ฌ์ง„์ด๋‚˜ ์˜์ƒ์„ ์ €์žฅํ•˜๊ณ  ๋ณด๋Š” ๊ฒƒ์— ๊ทธ์ณค๋‹ค๋ฉด, ์ด์ œ๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ๊ทธ ์ด๋ฏธ์ง€์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•ด ๋‚ด๊ณ , ๋ถ„์„ํ•˜๊ณ , ํŒ๋‹จ๊นŒ์ง€ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์–ด์š”. ์•„, ์ด์ œ๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ๋„ ํ•˜์ฃ !
 
์ด๋Ÿฌํ•œ ์ปดํ“จํ„ฐ ๋น„์ „์€ ๊ฒฐ๋ก ์ ์œผ๋กœ ์ปดํ“จํ„ฐ๊ฐ€ ์ธ๊ฐ„์˜ ์‹œ๊ฐ์  ์ง€๊ฐ ๋Šฅ๋ ฅ์„ ๋ชจ๋ฐฉํ•˜๊ณ  ์ธ๊ฐ„์„ ๋›ฐ์–ด๋„˜๋Š” ์‹œ๊ฐ์  ์ง€๋Šฅ์„ ๊ฐ–๋Š” ๊ฒƒ์„ ์ง€ํ–ฅํ•˜๋ฉฐ ์ž์œจ ์ฃผํ–‰, ์˜๋ฃŒ ์˜์ƒ, ์ด๋ฏธ์ง€ ๊ฒ€์ƒ‰, ์–ผ๊ตด ์ธ์‹ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ํ™œ์šฉ๋˜๊ณ  ์žˆ์–ด์š”. ๋˜ํ•œ ์š”์ฆ˜์€ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ํŽธ์ง‘ํ•˜๋Š” ์ด๋ฏธ์ง€ ์ƒ์„ฑํ˜• AI๊ฐ€ ํฐ ๊ด€์‹ฌ์„ ๋ฐ›๊ณ  ์žˆ์–ด์š”.

 

์ง๋ฌด ๊ด€์ ์—์„œ ๋ณด๋ฉด ๊ธฐ์—…์˜ JD(Job Description)์—  'Computer Vision Engineer (AI/ML)'์ฒ˜๋Ÿผ ํ‘œ๊ธฐํ•˜๊ธฐ๋„ ํ•˜๊ณ  'AI/ML Engineer (Vision)' ์ฒ˜๋Ÿผ ํ‘œ๊ธฐํ•˜๊ธฐ๋„ ํ•œ๋‹ค. ๋ฌผ๋ก  ์–ด๋””์— ์กฐ๊ธˆ ๋” ์ดˆ์ ์„ ๋งž์ถ˜ ์ง๋ฌด์ธ์ง€์— ๋”ฐ๋ผ ํ‘œ๊ธฐ๋ช…๋„ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์ง€๋งŒ, ๋Œ€๋ถ€๋ถ„ ์ƒ๊ธฐ ๋‘ ์ง๋ฌด๋Š” ์œ ์‚ฌํ•œ ์—…๋ฌด๋ฅผ ๋งก๊ฒŒ ๋œ๋‹ค.

 

์ปดํ“จํ„ฐ ๋น„์ „์˜  ๊ธฐ์ˆ ์˜ ์›๋ฆฌ

๊ทธ๋ ‡๋‹ค๋ฉด ์ปดํ“จํ„ฐ ๋น„์ „์ด ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๋Š”์ง€ ๊ถ๊ธˆํ•˜์ง€ ์•Š์œผ์„ธ์š”? ์ปดํ“จํ„ฐ๊ฐ€ ์ด๋ฏธ์ง€๋ฅผ ์ดํ•ดํ•˜๋Š” ๋ฐฉ์‹์€ ์กฐ๊ธˆ ๋ณต์žกํ•œ๋ฐ์š”. ์ปดํ“จํ„ฐ๋Š” ์‚ฌ์‹ค ์ด๋ฏธ์ง€๋ฅผ ์ˆ˜๋งŽ์€ ์ˆซ์ž, ์ฆ‰ ํ”ฝ์…€๋กœ ์ดํ•ดํ•ด์š”. ์ด ํ”ฝ์…€๋“ค์„ ๋ถ„์„ํ•ด์„œ ํŠน์ • ํŒจํ„ด์„ ์ฐพ์•„๋‚ด๊ณ , ์ด ํŒจํ„ด์ด ์˜๋ฏธํ•˜๋Š” ๊ฒƒ์„ ํ•™์Šตํ•˜๋Š” ๊ฑฐ์ฃ . ์˜ˆ๋ฅผ ๋“ค์–ด, ์–ผ๊ตด ์ธ์‹์—์„œ๋Š” ์ˆ˜๋งŽ์€ ์–ผ๊ตด ์‚ฌ์ง„์„ ์ปดํ“จํ„ฐ์—๊ฒŒ ๋ณด์—ฌ์ฃผ๊ณ , "์ด๊ฑด ๋ˆˆ, ์ด๊ฑด ์ฝ”"์ฒ˜๋Ÿผ ๊ฐ€๋ฅด์ณ์ค˜์š”. ๊ทธ๋Ÿฌ๋ฉด ์ปดํ“จํ„ฐ๊ฐ€ ๋‚˜์ค‘์— ์ƒˆ๋กœ์šด ์–ผ๊ตด์„ ๋ดค์„ ๋•Œ "์•„, ์ด๊ฒŒ ๋ˆˆ์ด๊ณ  ์ฝ”๊ตฌ๋‚˜!"๋ผ๊ณ  ์ดํ•ดํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜๋Š” ๊ฑฐ์˜ˆ์š”.

 

์ง€๊ธˆ๋ถ€ํ„ฐ๋Š” ์ปดํ“จํ„ฐ ๋น„์ „์˜ ๋‹ค์–‘ํ•œ ๊ธฐ์ˆ ๋“ค์— ๋Œ€ํ•ด ์•Œ์•„ ๋ณผ๊ฒŒ์š”!


Image Classification (์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜)

 

์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๋Š” ์ฃผ์–ด์ง„ ์ด๋ฏธ์ง€๋ฅผ ์‚ฌ์ „์— ์ •์˜๋œ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ฐœ์™€ ๊ณ ์–‘์ด๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ฑฐ๋‚˜, ๋‹ค์–‘ํ•œ ์Œ์‹ ์ข…๋ฅ˜๋ฅผ ์‹๋ณ„ํ•˜๋Š” ์ž‘์—…์ด ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ์ปดํ“จํ„ฐ๋น„์ „, CNN, ๋”ฅ๋Ÿฌ๋‹์„ ์ฒ˜์Œ ๊ณต๋ถ€ํ•  ๋•Œ ์ ‘ํ•˜๊ฒŒ ๋˜๋Š” ๊ธฐ์ˆ ์ด์ฃ .

 

Object Detection & Tracking (๊ฐ์ฒด ๊ฒ€์ถœ ๋ฐ ์ถ”์ )

 

๊ฐ์ฒด ๊ฒ€์ถœ์€ ์ด๋ฏธ์ง€๋‚˜ ์˜์ƒ์—์„œ ํŠน์ • ๊ฐ์ฒด๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ๊ทธ ์œ„์น˜๋ฅผ ์•Œ์•„๋‚ด๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์ด๋ ‡๊ฒŒ ๊ฒ€์ถœ๋œ ๊ฐ์ฒด๋ฅผ ์—ฐ์†๋œ ํ”„๋ ˆ์ž„์—์„œ ์ถ”์ ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ์ฒด ์ถ”์ ์ž…๋‹ˆ๋‹ค. ๋น„์ „ ๊ธฐ์ˆ ์—์„œ ๊ฐ€์žฅ ๋งŽ์ด ์‚ฌ์šฉ๋˜๋Š” ๊ธฐ์ˆ  ์ค‘ ํ•˜๋‚˜๊ฐ€ ๊ฐ์ฒด ๊ฒ€์ถœ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋Š”๋ฐ์š”. ์ž์œจ ์ฃผํ–‰, ๋ณด์•ˆ, ์Šคํฌ์ธ  ๋ถ„์„, ๊ตํ†ต ํ†ต์ œ, ์ฆ๊ฐ• ํ˜„์‹ค ๋“ฑ ์ •๋ง ๋‹ค์–‘ํ•œ ๊ณณ์—์„œ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. YOLO, Faster R-CNN, DETR ๊ฐ™์€ ๋ชจ๋ธ๋“ค์ด ๋Œ€ํ‘œ์ ์ž…๋‹ˆ๋‹ค.

 

 

Image Segmentation (์ด๋ฏธ์ง€ ๋ถ„ํ• )

 

์ด๋ฏธ์ง€ ๋ถ„ํ• ์€ ์ด๋ฏธ์ง€์—์„œ ํ”ฝ์…€ ๋‹จ์œ„๋กœ ๊ฐ์ฒด๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ํŠนํžˆ, ์ด๋ฏธ์ง€๋ฅผ ์„ธ๋ฐ€ํ•˜๊ฒŒ ๋ถ„์„ํ•˜๊ฑฐ๋‚˜, ๋ฐฐ๊ฒฝ๊ณผ ์ „๊ฒฝ์„ ๋ถ„๋ฆฌํ•˜๋Š” ์ž‘์—…์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. Semantic Segmentation๊ณผ Instance Segmentation์ด ๋Œ€ํ‘œ์ ์ธ ์œ ํ˜•์ž…๋‹ˆ๋‹ค. ๊ฐ์ฒด ๊ฒ€์ถœ๊ณผ ๋”๋ถˆ์–ด ๊ต‰์žฅํžˆ ๋‹ค์–‘ํ•œ ๊ณณ์—์„œ ํ™œ์šฉ๋˜๋Š” ๊ธฐ์ˆ ๋กœ ์ž์œจ ์ฃผํ–‰, ์˜๋ฃŒ, ๋กœ๋ณดํ‹ฑ์Šค ๋“ฑ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

 

 

Medical Image Analysis (์˜๋ฃŒ ์˜์ƒ ๋ถ„์„)

 

์˜๋ฃŒ ์˜์ƒ ๋ถ„์„์€ MRI, CT ์Šค์บ” ๋“ฑ๊ณผ ๊ฐ™์€ ์˜๋ฃŒ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„์„ํ•˜์—ฌ ์งˆ๋ณ‘์„ ์ง„๋‹จํ•˜๊ฑฐ๋‚˜ ์น˜๋ฃŒ ๊ณ„ํš์„ ์„ธ์šฐ๋Š” ๋ฐ ํ™œ์šฉ๋ผ์š”. ํŠนํžˆ, ์•” ์กฐ๊ธฐ ์ง„๋‹จ, ์žฅ๊ธฐ ๋ถ„ํ• , ๋ณ‘๋ณ€ ํƒ์ง€ ๋“ฑ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

 

 

Human Pose Estimation (ํœด๋จผ ํฌ์ฆˆ ์ถ”์ •)

 

ํœด๋จผ ํฌ์ฆˆ ์ถ”์ •์€ ์‚ฌ๋žŒ์˜ ๊ด€์ ˆ ๋“ฑ์˜ ํ‚คํฌ์ธํŠธ๋ฅผ ์ถ”์ •ํ•˜์—ฌ ์‹ ์ฒด์˜ ์ž์„ธ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์ด ๊ธฐ์ˆ ์€ ํ™ˆ ํŠธ๋ ˆ์ด๋‹, ์Šคํฌ์ธ  ๋™์ž‘ ๋ถ„์„, ๋ชจ์…˜ ์บก์ฒ˜, ๊ฒŒ์ž„ ์ธํ„ฐ๋ž™์…˜ ๋“ฑ์—์„œ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.

 
 

Action Recognition (ํ–‰๋™ ์ธ์‹)

 

ํ–‰๋™ ์ธ์‹์€ ์˜์ƒ์—์„œ ์‚ฌ๋žŒ์˜ ํ–‰๋™์„ ์ธ์‹ํ•˜๊ณ  ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ธฐ์ˆ ์ž…์ด์—์š”. ๊ฐ์‹œ ์‹œ์Šคํ…œ, ํ—ฌ์Šค์ผ€์–ด, ์Šคํฌ์ธ  ์ค‘๊ณ„, ์ธ๊ฐ„-๋กœ๋ด‡ ์ƒํ˜ธ์ž‘์šฉ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ์–ด์š”.

 

 

Depth Estimation (๊นŠ์ด ์ถ”์ •)

 

๊นŠ์ด ์ถ”์ •์€ 2D ์ด๋ฏธ์ง€๋‚˜ ์˜์ƒ์—์„œ ๊ฐ ํ”ฝ์…€์˜ ๊นŠ์ด ์ •๋ณด๋ฅผ ์ถ”์ •ํ•˜์—ฌ 3D ์ •๋ณด๋ฅผ ์–ป๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์ด๋Š” ์ž์œจ ์ฃผํ–‰, ์ฆ๊ฐ• ํ˜„์‹ค(AR), ๋กœ๋ด‡ ๋น„์ „ ๋“ฑ์—์„œ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.

 

 

3D Reconstruction (3D ๋ณต์›)

 

3D ๋ณต์›์€ ์—ฌ๋Ÿฌ ๋‹ค์‹œ์  ์ด๋ฏธ์ง€๋‚˜ ๋™์˜์ƒ์œผ๋กœ๋ถ€ํ„ฐ ๊ฐ์ฒด๋‚˜ ์žฅ๋ฉด์˜ 3D ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ๋ฌธํ™”์žฌ ๋ณต์›, ๊ฒŒ์ž„, ์˜ํ™” ์ œ์ž‘, ๊ฐ€์ƒ ํ˜„์‹ค(VR) ๋“ฑ์—์„œ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.

 

 

Super Resolution (์ดˆํ•ด์ƒ๋„)

์ดˆํ•ด์ƒ๋„๋Š” ์ €ํ•ด์ƒ๋„ ์ด๋ฏธ์ง€๋ฅผ ๊ณ ํ•ด์ƒ๋„๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์ด๋ฏธ์ง€ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ์„ธ๋ถ€ ์ •๋ณด๋ฅผ ๋ณต์›ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋ฉฐ, ์ตœ๊ทผ์—๋Š” ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ๋ฐฉ๋ฒ•๋“ค์ด ์ฃผ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๊ฒŒ์ž„, ์›นํˆฐ, ์˜๋ฃŒ, ๋ฒ”์ฃ„ ์ˆ˜์‚ฌ ๋“ฑ์— ํ™œ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค

 

 

Image Generation (์ด๋ฏธ์ง€ ์ƒ์„ฑ)

 

์ด๋ฏธ์ง€ ์ƒ์„ฑ์€ ์ฃผ์–ด์ง„ ์กฐ๊ฑด์ด๋‚˜ ์ž„์˜์˜ ์ž…๋ ฅ์„ ๋ฐ”ํƒ•์œผ๋กœ ์ƒˆ๋กœ์šด ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์•„ํŠธ ์ƒ์„ฑ, ๋ฐ์ดํ„ฐ ์ฆ๊ฐ•, ์ด๋ฏธ์ง€ ๋ณ€ํ™˜ ๋“ฑ ๋‹ค์–‘ํ•œ ์‘์šฉ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์ตœ๊ทผ์—๋Š” ๋ฌธํ™”, ์˜ˆ์ˆ , ๋””์ž์ธ, ๊ฐœ์ธ ์ฐฝ์ž‘ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ํ™œ์šฉ๋˜๊ณ  ์žˆ์œผ๋ฉฐ ํ’ˆ์งˆ ๋˜ํ•œ ๊ต‰์žฅํžˆ ํ–ฅ์ƒ ๋˜์—ˆ์–ด์š”. ํŠนํžˆ ์ตœ๊ทผ์—๋Š” ์ž์—ฐ์Šค๋Ÿฌ์šด ๋™์˜์ƒ๊นŒ์ง€ ์ƒ์„ฑํ•˜๋Š” ๋‹จ๊ณ„๊นŒ์ง€ ์ด๋ฅด๋ €๋‹ต๋‹ˆ๋‹ค.

 

 

์‚ฐ์—…์—์„œ ๋˜๋Š” ์šฐ๋ฆฌ๊ฐ€ ์‚ด์•„๊ฐ€๋ฉฐ ๋งŒ๋‚  ์ˆ˜ ์žˆ๋Š” ์ปดํ“จํ„ฐ๋น„์ „ ๊ธฐ์ˆ ์€ ๊ฑฐ์˜๋‹ค ์„ค๋ช…๋“œ๋ฆฐ ๊ฒƒ ๊ฐ™์€๋ฐ์š”. ์‚ฌ์‹ค ํ•™๊ณ„์—์„œ์˜ ์ปดํ“จํ„ฐ ๋น„์ „์˜ ์˜์—ญ์€ ํ›จ์”ฌ ๋” ๋‹ค์–‘ํ•ฉ๋‹ˆ๋‹ค. ์•„์ฃผ fundamental ํ•œ ๊ฒƒ๋ถ€ํ„ฐ, ์‘์šฉ ๊ธฐ์ˆ ๊นŒ์ง€ ๋‹ค์–‘ํ•ด์š”. 


 

์ปดํ“จํ„ฐ ๋น„์ „์€ ์ธ๊ฐ„์˜ ์‹œ๊ฐ ๋Šฅ๋ ฅ์„ ๊ธฐ๊ณ„์— ๋ถ€์—ฌํ•˜์—ฌ ์ด๋ฏธ์ง€์™€ ์˜์ƒ์„ ์ดํ•ดํ•˜๊ณ  ๋ถ„์„ํ•˜๋Š” ๊ฐ•๋ ฅํ•œ ๋„๊ตฌ์—์š”. ์ตœ๊ทผ์—๋Š” AI ๊ธฐ์ˆ ์ด ๋ฐœ์ „ํ•˜๋ฉฐ ๋‹ค์–‘ํ•œ ์‚ฐ์—… ๋ถ„์•ผ์—์„œ ์ปดํ“จํ„ฐ ๋น„์ „ ๊ธฐ์ˆ ์ด ํ™œ์šฉ๋˜๊ณ  ์žˆ๋Š” ์ถ”์„ธ์—์š”. ์ด๋ฒˆ ๊ธ€์„ ํ†ตํ•ด ์ปดํ“จํ„ฐ ๋น„์ „์˜ ๊ธฐ๋ณธ ๊ฐœ๋…๊ณผ ์ฃผ์š” ๊ธฐ์ˆ ๋“ค์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋˜์—ˆ๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค. ๋น„์ „ ๊ธฐ์ˆ ์— ๋Œ€ํ•ด ๋” ๊ถ๊ธˆํ•˜๋‹ค๋ฉด ๋Œ“๊ธ€์ด๋‚˜ ์—ฐ๋ฝ์ฃผ์„ธ์š”!

๋ฐ˜์‘ํ˜•