๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ“– Theory/Computer Vision

Computer Vision (์ปดํ“จํ„ฐ๋น„์ „) ์ด๋ž€?

by ๋ญ…์ฆค 2023. 4. 7.
๋ฐ˜์‘ํ˜•
Computer Vision (์ปดํ“จํ„ฐ ๋น„์ „)

 
Computer Vision (์ปดํ“จํ„ฐ ๋น„์ „)์€ ์ปดํ“จํ„ฐ๊ฐ€ ๋””์ง€ํ„ธ ์ด๋ฏธ์ง€๋‚˜ ๋น„๋””์˜ค์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๊ณ  ํ•ด์„ํ•˜์—ฌ ์ธ์‹, ๋ถ„๋ฅ˜, ์ถ”์  ๋“ฑ์˜ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ปดํ“จํ„ฐ ๊ณผํ•™ ๋ถ„์•ผ์ด๋‹ค. ๊ฐ„๋‹จํžˆ ๋งํ•ด ๊ธฐ๊ณ„์˜ '๋ˆˆ' ์—ญํ• ์„ ๋‹ด๋‹นํ•˜๋Š” ๊ธฐ์ˆ ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์ผ๋ถ€๋Š” ์ปดํ“จํ„ฐ๋น„์ „์ด AI/ML ๊ธฐ์ˆ ์˜ ์ผํ™˜์ด๋ผ๊ณ  ์„ค๋ช…ํ•˜๊ธฐ๋„ ํ•˜์ง€๋งŒ, ์—„๋ฐ€ํžˆ ๋”ฐ์ง€๋ฉด AI์˜ ์—ฌ๋Ÿฌ ๋ถ„์•ผ ์ค‘ ์ปดํ“จํ„ฐ๋น„์ „ ๋„๋ฉ”์ธ์ด ์žˆ๋Š” ๊ฒƒ์ด์ง€ ์ปดํ“จํ„ฐ๋น„์ „ ์ž์ฒด๊ฐ€ AI ๊ธฐ์ˆ ์€ ์•„๋‹ˆ๋‹ค. AI/ML ๊ธฐ์ˆ ์ด ๊ธ‰๋ถ€์ƒํ•˜๊ธฐ ์ „์—๋„ ์ „ํ†ต์ ์ธ ์ปดํ“จํ„ฐ๋น„์ „ ๋ถ„์•ผ๊ฐ€ ์กด์žฌํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. AI๋ฅผ ๋„๊ตฌ์  ๊ด€์ ์„ ๋ณธ๋‹ค๋ฉด ์˜คํžˆ๋ ค ์ปดํ“จํ„ฐ๋น„์ „ ๋ถ„์•ผ ์ค‘์—์„œ AI ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•˜๋Š” ๋ถ„์•ผ๊ฐ€ ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ๋ฌผ๋ก  ์ตœ๊ทผ ๋Œ€๋ถ€๋ถ„์˜(๊ฑฐ์˜ ๋ชจ๋“ ) ์ปดํ“จํ„ฐ๋น„์ „ ์—ฐ๊ตฌ์™€ ํ”„๋กœ์ ํŠธ๊ฐ€ AI/ML ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— AI ๊ธฐ์ˆ ์˜ ์ผ๋ถ€๋กœ ๋ณด๋Š” ๊ฒƒ์ด ์–ด์ƒ‰ํ•˜์ง„ ์•Š๋‹ค.
 
์ง๋ฌด ๊ด€์ ์—์„œ ๋ณด๋ฉด ๊ธฐ์—…์˜ JD(Job Description)์—  'Computer Vision Engineer (AI/ML)'์ฒ˜๋Ÿผ ํ‘œ๊ธฐํ•˜๊ธฐ๋„ ํ•˜๊ณ  'AI/ML Engineer (Vision)' ์ฒ˜๋Ÿผ ํ‘œ๊ธฐํ•˜๊ธฐ๋„ ํ•œ๋‹ค. ๋ฌผ๋ก  ์–ด๋””์— ์กฐ๊ธˆ ๋” ์ดˆ์ ์„ ๋งž์ถ˜ ์ง๋ฌด์ธ์ง€์— ๋”ฐ๋ผ ํ‘œ๊ธฐ๋ช…๋„ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์ง€๋งŒ, ๋Œ€๋ถ€๋ถ„ ์ƒ๊ธฐ ๋‘ ์ง๋ฌด๋Š” ์œ ์‚ฌํ•œ ์—…๋ฌด๋ฅผ ๋งก๊ฒŒ ๋œ๋‹ค.
 
์ด๋Ÿฌํ•œ ์ปดํ“จํ„ฐ ๋น„์ „์€ ๊ฒฐ๋ก ์ ์œผ๋กœ ์ปดํ“จํ„ฐ๊ฐ€ ์ธ๊ฐ„์˜ ์‹œ๊ฐ์  ์ง€๊ฐ ๋Šฅ๋ ฅ์„ ๋ชจ๋ฐฉํ•˜๊ณ  ์ธ๊ฐ„์„ ๋›ฐ์–ด๋„˜๋Š” ์‹œ๊ฐ์  ์ง€๋Šฅ์„ ๊ฐ–๋Š” ๊ฒƒ์„ ์ง€ํ–ฅํ•˜๋ฉฐ ์ฃผ๋กœ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ถ„์•ผ์—์„œ ํ™œ์šฉ๋œ๋‹ค. ๋˜ํ•œ ์š”์ฆ˜์€ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋˜๋Š” Multi-modal (๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ) ๊ธฐ์ˆ ์ด ๋“ฑ์žฅํ•˜์—ฌ, ์ปดํ“จํ„ฐ ๋น„์ „๊ณผ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฅผ ๊ฒฐํ•ฉํ•œ ๊ธฐ์ˆ ์ด ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ด์ œ๋Š” ์ปดํ“จํ„ฐ ๋น„์ „ ๊ธฐ์ˆ ๊ณผ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๊ธฐ์ˆ ์ด ํ•จ๊ป˜ ํ™œ์šฉ๋˜๋Š” ๊ฒฝ์šฐ๋„ ๋งŽ์•„์ง€๊ณ  ์žˆ๋‹ค.
 

Image Classification (์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜)

  • ์ด๋ฏธ์ง€๋ฅผ ์ธ์‹ํ•˜๊ณ  ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ธฐ์ˆ 
  • ์ƒํ’ˆ ๋ถ„๋ฅ˜, ์ด๋ฏธ์ง€ ๊ฒ€์ƒ‰, ์–ผ๊ตด ์ธ์‹ ๋“ฑ์— ํ™œ์šฉ

 

Object Detection & Tracking (๊ฐ์ฒด ๊ฒ€์ถœ ๋ฐ ์ถ”์ )

  • ํŠน์ • ๊ฐ์ฒด์˜ ์œ„์น˜๋ฅผ ์ฐพ์•„๋‚ด๊ฑฐ๋‚˜ ์ถ”์ ํ•˜๋Š” ๊ธฐ์ˆ 
  • ์ž์œจ์ฃผํ–‰, CCTV ์˜์ƒ ๋ณด์•ˆ, ๊ตํ†ต ํ†ต์ œ, ์ฆ๊ฐ• ํ˜„์‹ค ๋“ฑ์— ํ™œ์šฉ

 

Segmentation (๊ฐ์ฒด ๋ถ„ํ• )

  • ํ”ฝ์…€ ์ˆ˜์ค€์—์„œ ๊ฐ์ฒด๋ฅผ ๋ถ„ํ• ํ•˜๊ณ  ์ธ์‹ํ•˜๋Š” ๊ธฐ์ˆ 
  • ๊ฐ์ฒด ๊ฒ€์ถœ๋ณด๋‹ค ๋”์šฑ ์ƒ์„ธํ•œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ˆ 
  • ๋กœ๋ณดํ‹ฑ์Šค, ์˜๋ฃŒ, ์ž์œจ ์ฃผํ–‰ ๋“ฑ์— ํ™œ์šฉ

 

 

Medical Image (์˜๋ฃŒ ์˜์ƒ) ๋ถ„์„

  • X-ray, CT, MRI ๋“ฑ์˜ ์˜์ƒ์„ ๋ถ„์„ํ•˜๊ณ  ๊ฐ์ข… ๋น„์ •์ƒ ์ •๋ณด๋ฅผ ์ถ”์ถœ

 

Human Pose Estimation (ํœด๋จผ ํฌ์ฆˆ ์ถ”์ •)

  • ์ธ๊ฐ„์˜ ๊ด€์ ˆ ๋“ฑ์˜ ํŠน์ • ํ‚คํฌ์ธํŠธ๋ฅผ ํŒŒ์•…ํ•˜์—ฌ ์ž์„ธ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๊ธฐ์ˆ 
  • ํ™ˆํŠธ๋ ˆ์ด๋‹, ๊ฐ€์ƒ ์ธ๊ฐ„ ๋“ฑ์— ํ™œ์šฉ

 
 

Action Recognition (ํ–‰๋™ ์ธ์‹)

  • ์ธ๊ฐ„์˜ ํ–‰๋™์„ ์ธ์‹ํ•˜๋Š” ๊ธฐ์ˆ 
  • ์˜์ƒ ๊ด€์ œ ์‹œ์Šคํ…œ, ์Šคํฌ์ธ  ์ค‘๊ณ„ ๋“ฑ์— ํ™œ์šฉ

 

Depth Estimation (๊นŠ์ด ์ถ”์ •)

  • 3์ฐจ์› ๊ณต๊ฐ„์—์„œ ๊ฐ์ฒด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๊ธฐ์ˆ 
  • ์ผ๋ฐ˜์ ์œผ๋กœ multi-view stereo ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•˜์ง€๋งŒ ๋‹จ์ผ ์ด๋ฏธ์ง€๋กœ ๊ฑฐ๋ฆฌ๋ฅผ ์ถ”์ •ํ•˜๊ธฐ๋„ ํ•จ
  • ๋กœ๋ณดํ‹ฑ์Šค, ์ž์œจ์ฃผํ–‰ ๋“ฑ์— ํ™œ์šฉ

 

 

3D Reconstruction (3D ๋ณต์›)

  • ์—ฌ๋Ÿฌ ๋‹ค์‹œ์  ์˜์ƒ์—์„œ 3D ๊ฐ์ฒด๋ฅผ ๋ณต์›ํ•˜๋Š” ๊ธฐ์ˆ 
  • AR/VR, ๊ฒŒ์ž„, ๋กœ๋ณดํ‹ฑ์Šค ๋ถ„์•ผ์—์„œ ํ™œ์šฉ

 

Super Resolution (์ดˆํ•ด์ƒ๋„)

  • ์ €ํ•ด์ƒ๋„์˜ ์˜์ƒ์„ ๊ณ ํ•ด์ƒ๋„๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ธฐ์ˆ 
  • ๊ฒŒ์ž„, ์›นํˆฐ ๋ถ„์•ผ์—์„œ ๋ฐ์ดํ„ฐ ์ „์†ก๋Ÿ‰์„ ์ค„์ด๋Š” ๋ฐ ํ™œ์šฉ 
  • ์˜๋ฃŒ, ๋ฒ”์ฃ„ ์ˆ˜์‚ฌ ๋“ฑ์—์„œ๋„ ํ™œ์šฉ

 

Image Generation (์ด๋ฏธ์ง€ ์ƒ์„ฑ)

  • ํ…์ŠคํŠธ ์ž…๋ ฅ ๋˜๋Š” ๊ฐ„๋‹จํ•œ ์Šค์ผ€์น˜๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์›ํ•˜๋Š” ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑ/ํŽธ์ง‘ ํ•˜๋Š” ๊ธฐ์ˆ 
  • ๋ฌธํ™”/์˜ˆ์ˆ /๋””์ž์ธ/๊ฐœ์ธ ์ฐฝ์ž‘ ๋“ฑ์˜ ๋ถ„์•ผ์—์„œ ํ™œ์šฉ 

 

๋ฐ˜์‘ํ˜•