πŸ“– Theory/Computer Vision

"컴퓨터 λΉ„μ „"에 λŒ€ν•΄ μ•Œμ•„λ³΄μž | Computer Vision & AI & Deep Learning

뭅즀 2023. 4. 7. 11:46
λ°˜μ‘ν˜•
Computer Vision (컴퓨터 λΉ„μ „)

 
컴퓨터 λΉ„μ „(Computer Vision)은 말 κ·ΈλŒ€λ‘œ 컴퓨터가 'μ‹œκ°'을 κ°€μ§€κ²Œ ν•˜λŠ” κΈ°μˆ μ΄μ—μš”. μ‰½κ²Œ 말해, μš°λ¦¬κ°€ 눈으둜 세상을 λ³΄λŠ” κ²ƒμ²˜λŸΌ, 컴퓨터가 μ΄λ―Έμ§€λ‚˜ λ™μ˜μƒμ„ 톡해 μ£Όλ³€ ν™˜κ²½μ„ μΈμ‹ν•˜κ³  이해할 수 μžˆλ„λ‘ λ§Œλ“œλŠ” 기술이죠. μ˜ˆμ „μ—λŠ” λ‹¨μˆœνžˆ μΉ΄λ©”λΌλ‘œ 찍은 μ‚¬μ§„μ΄λ‚˜ μ˜μƒμ„ μ €μž₯ν•˜κ³  λ³΄λŠ” 것에 κ·Έμ³€λ‹€λ©΄, μ΄μ œλŠ” 컴퓨터가 κ·Έ μ΄λ―Έμ§€μ—μ„œ 정보λ₯Ό μΆ”μΆœν•΄ λ‚΄κ³ , λΆ„μ„ν•˜κ³ , νŒλ‹¨κΉŒμ§€ ν•  수 있게 λ˜μ—ˆμ–΄μš”. μ•„, μ΄μ œλŠ” 컴퓨터가 이미지λ₯Ό μƒμ„±ν•˜κΈ°λ„ ν•˜μ£ !
 
μ΄λŸ¬ν•œ 컴퓨터 비전은 결둠적으둜 컴퓨터가 μΈκ°„μ˜ μ‹œκ°μ  지각 λŠ₯λ ₯을 λͺ¨λ°©ν•˜κ³  인간을 λ›°μ–΄λ„˜λŠ” μ‹œκ°μ  지λŠ₯을 κ°–λŠ” 것을 지ν–₯ν•˜λ©° 자율 μ£Όν–‰, 의료 μ˜μƒ, 이미지 검색, μ–Όκ΅΄ 인식 λ“± λ‹€μ–‘ν•œ λΆ„μ•Όμ—μ„œ ν™œμš©λ˜κ³  μžˆμ–΄μš”. λ˜ν•œ μš”μ¦˜μ€ 이미지λ₯Ό μƒμ„±ν•˜κ³  νŽΈμ§‘ν•˜λŠ” 이미지 μƒμ„±ν˜• AIκ°€ 큰 관심을 λ°›κ³  μžˆμ–΄μš”.

 

직무 κ΄€μ μ—μ„œ 보면 κΈ°μ—…μ˜ JD(Job Description)에  'Computer Vision Engineer (AI/ML)'처럼 ν‘œκΈ°ν•˜κΈ°λ„ ν•˜κ³  'AI/ML Engineer (Vision)' 처럼 ν‘œκΈ°ν•˜κΈ°λ„ ν•œλ‹€. λ¬Όλ‘  어디에 쑰금 더 μ΄ˆμ μ„ 맞좘 직무인지에 따라 ν‘œκΈ°λͺ…도 λ‹¬λΌμ§ˆ 수 μžˆμ§€λ§Œ, λŒ€λΆ€λΆ„ 상기 두 μ§λ¬΄λŠ” μœ μ‚¬ν•œ 업무λ₯Ό 맑게 λœλ‹€.

 

컴퓨터 λΉ„μ „μ˜  기술의 원리

κ·Έλ ‡λ‹€λ©΄ 컴퓨터 비전이 μ–΄λ–»κ²Œ μž‘λ™ν•˜λŠ”μ§€ κΆκΈˆν•˜μ§€ μ•ŠμœΌμ„Έμš”? 컴퓨터가 이미지λ₯Ό μ΄ν•΄ν•˜λŠ” 방식은 쑰금 λ³΅μž‘ν•œλ°μš”. μ»΄ν“¨ν„°λŠ” 사싀 이미지λ₯Ό μˆ˜λ§Žμ€ 숫자, 즉 ν”½μ…€λ‘œ μ΄ν•΄ν•΄μš”. 이 픽셀듀을 λΆ„μ„ν•΄μ„œ νŠΉμ • νŒ¨ν„΄μ„ μ°Ύμ•„λ‚΄κ³ , 이 νŒ¨ν„΄μ΄ μ˜λ―Έν•˜λŠ” 것을 ν•™μŠ΅ν•˜λŠ” κ±°μ£ . 예λ₯Ό λ“€μ–΄, μ–Όκ΅΄ μΈμ‹μ—μ„œλŠ” μˆ˜λ§Žμ€ μ–Όκ΅΄ 사진을 μ»΄ν“¨ν„°μ—κ²Œ 보여주고, "이건 눈, 이건 μ½”"처럼 κ°€λ₯΄μ³μ€˜μš”. 그러면 컴퓨터가 λ‚˜μ€‘μ— μƒˆλ‘œμš΄ 얼꡴을 봀을 λ•Œ "μ•„, 이게 눈이고 μ½”κ΅¬λ‚˜!"라고 이해할 수 있게 λ˜λŠ” κ±°μ˜ˆμš”.

 

μ§€κΈˆλΆ€ν„°λŠ” 컴퓨터 λΉ„μ „μ˜ λ‹€μ–‘ν•œ κΈ°μˆ λ“€μ— λŒ€ν•΄ μ•Œμ•„ λ³Όκ²Œμš”!


Image Classification (이미지 λΆ„λ₯˜)

 

이미지 λΆ„λ₯˜λŠ” 주어진 이미지λ₯Ό 사전에 μ •μ˜λœ 클래슀 쀑 ν•˜λ‚˜λ‘œ λΆ„λ₯˜ν•˜λŠ” κΈ°μˆ μ΄μ—μš”. 예λ₯Ό λ“€μ–΄, κ°œμ™€ 고양이λ₯Ό λΆ„λ₯˜ν•˜κ±°λ‚˜, λ‹€μ–‘ν•œ μŒμ‹ μ’…λ₯˜λ₯Ό μ‹λ³„ν•˜λŠ” μž‘μ—…μ΄ 이미지 λΆ„λ₯˜μ— ν•΄λ‹Ήν•©λ‹ˆλ‹€. 컴퓨터비전, CNN, λ”₯λŸ¬λ‹μ„ 처음 곡뢀할 λ•Œ μ ‘ν•˜κ²Œ λ˜λŠ” 기술이죠.

 

Object Detection & Tracking (객체 κ²€μΆœ 및 좔적)

 

객체 κ²€μΆœμ€ μ΄λ―Έμ§€λ‚˜ μ˜μƒμ—μ„œ νŠΉμ • 객체λ₯Ό μ‹λ³„ν•˜κ³  κ·Έ μœ„μΉ˜λ₯Ό μ•Œμ•„λ‚΄λŠ” κΈ°μˆ μ΄μ—μš”. μ΄λ ‡κ²Œ κ²€μΆœλœ 객체λ₯Ό μ—°μ†λœ ν”„λ ˆμž„μ—μ„œ μΆ”μ ν•˜λŠ” 것이 객체 μΆ”μ μž…λ‹ˆλ‹€. λΉ„μ „ κΈ°μˆ μ—μ„œ κ°€μž₯ 많이 μ‚¬μš©λ˜λŠ” 기술 쀑 ν•˜λ‚˜κ°€ 객체 κ²€μΆœμ΄λΌκ³  λ³Ό 수 μžˆλŠ”λ°μš”. 자율 μ£Όν–‰, λ³΄μ•ˆ, 슀포츠 뢄석, ꡐ톡 ν†΅μ œ, 증강 ν˜„μ‹€ λ“± 정말 λ‹€μ–‘ν•œ κ³³μ—μ„œ μ‚¬μš©λ©λ‹ˆλ‹€. YOLO, Faster R-CNN, DETR 같은 λͺ¨λΈλ“€μ΄ λŒ€ν‘œμ μž…λ‹ˆλ‹€.

 

 

Image Segmentation (이미지 λΆ„ν• )

 

이미지 뢄할은 μ΄λ―Έμ§€μ—μ„œ ν”½μ…€ λ‹¨μœ„λ‘œ 객체λ₯Ό κ΅¬λΆ„ν•˜λŠ” κΈ°μˆ μ΄μ—μš”. 특히, 이미지λ₯Ό μ„Έλ°€ν•˜κ²Œ λΆ„μ„ν•˜κ±°λ‚˜, λ°°κ²½κ³Ό 전경을 λΆ„λ¦¬ν•˜λŠ” μž‘μ—…μ— μ‚¬μš©λ©λ‹ˆλ‹€. Semantic Segmentationκ³Ό Instance Segmentation이 λŒ€ν‘œμ μΈ μœ ν˜•μž…λ‹ˆλ‹€. 객체 κ²€μΆœκ³Ό λ”λΆˆμ–΄ ꡉμž₯히 λ‹€μ–‘ν•œ κ³³μ—μ„œ ν™œμš©λ˜λŠ” 기술둜 자율 μ£Όν–‰, 의료, λ‘œλ³΄ν‹±μŠ€ 등에 μ‚¬μš©λ©λ‹ˆλ‹€.

 

 

Medical Image Analysis (의료 μ˜μƒ 뢄석)

 

의료 μ˜μƒ 뢄석은 MRI, CT μŠ€μΊ” λ“±κ³Ό 같은 의료 이미지λ₯Ό λΆ„μ„ν•˜μ—¬ μ§ˆλ³‘μ„ μ§„λ‹¨ν•˜κ±°λ‚˜ 치료 κ³„νšμ„ μ„Έμš°λŠ” 데 ν™œμš©λΌμš”. 특히, μ•” μ‘°κΈ° 진단, μž₯κΈ° λΆ„ν• , 병변 탐지 등에 μ‚¬μš©λ©λ‹ˆλ‹€.

 

 

Human Pose Estimation (휴먼 포즈 μΆ”μ •)

 

휴먼 포즈 좔정은 μ‚¬λžŒμ˜ κ΄€μ ˆ λ“±μ˜ ν‚€ν¬μΈνŠΈλ₯Ό μΆ”μ •ν•˜μ—¬ μ‹ μ²΄μ˜ μžμ„Έλ₯Ό λΆ„μ„ν•˜λŠ” κΈ°μˆ μ΄μ—μš”. 이 κΈ°μˆ μ€ ν™ˆ νŠΈλ ˆμ΄λ‹, 슀포츠 λ™μž‘ 뢄석, λͺ¨μ…˜ 캑처, κ²Œμž„ μΈν„°λž™μ…˜ λ“±μ—μ„œ ν™œμš©λ©λ‹ˆλ‹€.

 
 

Action Recognition (행동 인식)

 

행동 인식은 μ˜μƒμ—μ„œ μ‚¬λžŒμ˜ 행동을 μΈμ‹ν•˜κ³  λΆ„λ₯˜ν•˜λŠ” κΈ°μˆ μž…μ΄μ—μš”. κ°μ‹œ μ‹œμŠ€ν…œ, ν—¬μŠ€μΌ€μ–΄, 슀포츠 쀑계, 인간-λ‘œλ΄‡ μƒν˜Έμž‘μš© λ“± λ‹€μ–‘ν•œ λΆ„μ•Όμ—μ„œ μ‚¬μš©λ˜κ³  μžˆμ–΄μš”.

 

 

Depth Estimation (깊이 μΆ”μ •)

 

깊이 좔정은 2D μ΄λ―Έμ§€λ‚˜ μ˜μƒμ—μ„œ 각 ν”½μ…€μ˜ 깊이 정보λ₯Ό μΆ”μ •ν•˜μ—¬ 3D 정보λ₯Ό μ–»λŠ” κΈ°μˆ μ΄μ—μš”. μ΄λŠ” 자율 μ£Όν–‰, 증강 ν˜„μ‹€(AR), λ‘œλ΄‡ λΉ„μ „ λ“±μ—μ„œ μ€‘μš”ν•œ 역할을 ν•©λ‹ˆλ‹€.

 

 

3D Reconstruction (3D 볡원)

 

3D 볡원은 μ—¬λŸ¬ λ‹€μ‹œμ  μ΄λ―Έμ§€λ‚˜ λ™μ˜μƒμœΌλ‘œλΆ€ν„° κ°μ²΄λ‚˜ μž₯면의 3D λͺ¨λΈμ„ μƒμ„±ν•˜λŠ” κΈ°μˆ μ΄μ—μš”. λ¬Έν™”μž¬ 볡원, κ²Œμž„, μ˜ν™” μ œμž‘, 가상 ν˜„μ‹€(VR) λ“±μ—μ„œ ν™œμš©λ©λ‹ˆλ‹€.

 

 

Super Resolution (μ΄ˆν•΄μƒλ„)

μ΄ˆν•΄μƒλ„λŠ” 저해상도 이미지λ₯Ό κ³ ν•΄μƒλ„λ‘œ λ³€ν™˜ν•˜λŠ” κΈ°μˆ μ΄μ—μš”. 이미지 ν’ˆμ§ˆμ„ ν–₯μƒμ‹œν‚€κ³ , μ„ΈλΆ€ 정보λ₯Ό λ³΅μ›ν•˜λŠ” 데 μ‚¬μš©λ˜λ©°, μ΅œκ·Όμ—λŠ” λ”₯λŸ¬λ‹ 기반의 방법듀이 주둜 μ‚¬μš©λ©λ‹ˆλ‹€. κ²Œμž„, μ›Ήνˆ°, 의료, 범죄 μˆ˜μ‚¬ 등에 ν™œμš©λ˜κ³  μžˆμŠ΅λ‹ˆλ‹€

 

 

Image Generation (이미지 생성)

 

이미지 생성은 주어진 μ‘°κ±΄μ΄λ‚˜ μž„μ˜μ˜ μž…λ ₯을 λ°”νƒ•μœΌλ‘œ μƒˆλ‘œμš΄ 이미지λ₯Ό μƒμ„±ν•˜λŠ” κΈ°μˆ μ΄μ—μš”. μ•„νŠΈ 생성, 데이터 증강, 이미지 λ³€ν™˜ λ“± λ‹€μ–‘ν•œ μ‘μš©μ΄ κ°€λŠ₯ν•©λ‹ˆλ‹€. μ΅œκ·Όμ—λŠ” λ¬Έν™”, 예술, λ””μžμΈ, 개인 μ°½μž‘ λ“± λ‹€μ–‘ν•œ λΆ„μ•Όμ—μ„œ ν™œμš©λ˜κ³  있으며 ν’ˆμ§ˆ λ˜ν•œ ꡉμž₯히 ν–₯상 λ˜μ—ˆμ–΄μš”. 특히 μ΅œκ·Όμ—λŠ” μžμ—°μŠ€λŸ¬μš΄ λ™μ˜μƒκΉŒμ§€ μƒμ„±ν•˜λŠ” λ‹¨κ³„κΉŒμ§€ 이λ₯΄λ €λ‹΅λ‹ˆλ‹€.

 

 

μ‚°μ—…μ—μ„œ λ˜λŠ” μš°λ¦¬κ°€ μ‚΄μ•„κ°€λ©° λ§Œλ‚  수 μžˆλŠ” 컴퓨터비전 κΈ°μˆ μ€ κ±°μ˜λ‹€ μ„€λͺ…λ“œλ¦° 것 κ°™μ€λ°μš”. 사싀 ν•™κ³„μ—μ„œμ˜ 컴퓨터 λΉ„μ „μ˜ μ˜μ—­μ€ 훨씬 더 λ‹€μ–‘ν•©λ‹ˆλ‹€. μ•„μ£Ό fundamental ν•œ 것뢀터, μ‘μš© κΈ°μˆ κΉŒμ§€ λ‹€μ–‘ν•΄μš”. 


 

컴퓨터 비전은 μΈκ°„μ˜ μ‹œκ° λŠ₯λ ₯을 기계에 λΆ€μ—¬ν•˜μ—¬ 이미지와 μ˜μƒμ„ μ΄ν•΄ν•˜κ³  λΆ„μ„ν•˜λŠ” κ°•λ ₯ν•œ λ„κ΅¬μ—μš”. μ΅œκ·Όμ—λŠ” AI 기술이 λ°œμ „ν•˜λ©° λ‹€μ–‘ν•œ μ‚°μ—… λΆ„μ•Όμ—μ„œ 컴퓨터 λΉ„μ „ 기술이 ν™œμš©λ˜κ³  μžˆλŠ” μΆ”μ„Έμ—μš”. 이번 글을 톡해 컴퓨터 λΉ„μ „μ˜ κΈ°λ³Έ κ°œλ…κ³Ό μ£Όμš” κΈ°μˆ λ“€μ„ μ΄ν•΄ν•˜λŠ” 데 도움이 λ˜μ—ˆκΈΈ λ°”λžλ‹ˆλ‹€. λΉ„μ „ κΈ°μˆ μ— λŒ€ν•΄ 더 κΆκΈˆν•˜λ‹€λ©΄ λŒ“κΈ€μ΄λ‚˜ μ—°λ½μ£Όμ„Έμš”!

λ°˜μ‘ν˜•