์ปดํจํฐ ๋น์ & ๋ฅ๋ฌ๋ ์ง๋ฌด๋ก ์ฑ์ฉ ๊ณผ์ ์ค ๊ณผ์ ๋ฐ ๋ฉด์ ์ ๋ณด๋ฉด์ ๋ฐ์ ์ง๋ฌธ๋ค๊ณผ ๋ฌผ์ด๋ณผ๋งํ ์ง๋ฌธ๋ค์ ์์ด์ ์ ๋ฆฌํฉ๋๋ค. ์ง๋ฌธ ๋ด์ฉ์ ๊ทธ๋๋ก ์ ์ผ๋ฉด ๋ฌธ์ ๊ฐ ๋ ์๋ ์๊ธฐ์ ์ค์ ๋ก ๋ฐ์ ์ง๋ฌธ์ ๋นํด ๋ค์ ์ฌํํ๊ฒ ์นดํ ๊ณ ๋ฆฌ๋ง ์ ๊ฒ ์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ฌ๋ฌ ๋ฉด์ ์์ ์ค๋ณต๋๊ฒ ๋ฌผ์ด๋ณด๋ ๋ถ๋ถ์ ๊ตต๊ฒ ํ์ํ์ต๋๋ค.
ํ์ฌ๋ง๋ค ๊ฐ ๋ถ์ผ๋ง๋ค ๋ค๋ฅด์ง๋ง ๊ต์ฅํ ๊ธฐ๋ณธ์ ์ธ ๊ฒ ์์ฃผ๋ก ๋ฌผ์ด๋ณด๋ ๊ณณ๋ ์๊ณ , ์์ฃผ ๋ฅํ๊ณ ์ด๋ ค์ด ์ง๋ฌธ(์ ๋ต์ด ์๋)์ ํ๊ฑฐ๋ ๋นํด์ ๋ฐํ๋ ๋ ผ๋ฌธ๊ณผ ๊ทธ ๋ ผ๋ฌธ์ ์ฃผ์ contribution์ ๋ฌผ์ด๋ณด๋ ๊ณณ๋ ๋ง์ต๋๋ค. ์ง๋ฌธ๊ณผ ๊ด๋ จ๋ ๋ ผ๋ฌธ์ ์๋ดค์ผ๋ฉด... ์ฒจ ๋ค์ด๋ด ๋๋ค.. ๋ง ๋ฐ๋ณตํด์ผ ํฉ๋๋ค ใ .
์ฌ์ค ๋ง์ ์ง๋ฌธ๋ค์ด ์ธ์๊ฐ๋ค๊ณ ํด๊ฒฐ์ด ์๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค ใ
+ ์ฌ์ค ์์ฌ ์ด์์ ๊ฐ์ธ ์ฐ๊ตฌ์ ๋ํ ์ง๋ฌธ์ด ์ ์ผ ๋ง์ ๊ฒ ๊ฐ์ต๋๋ค.
++ ์ฐ๊ตฌ ์ฃผ์ ๋ฐํํ๋ค๊ฐ ๋ฉด์ ๊ด๊ป์ ์ ์๋ ๋ถ๋ถ์ด ์์ผ๋ฉด ๊ทธ ๋ถ๋ถ์ด ๋ด ์ฐ๊ตฌ์์ ํฌ๊ฒ ์ค์ํ์ง ์๋๋ผ๋ ๊ณ์ ๋ฌผ์ด๋ณผ ์ ์์ผ๋... ์ค๋น๋ฅผ ์ํด์ผ ํฉ๋๋ค.
+++ 2022๋ 2๋ถ๊ธฐ ๊ธฐ์ค
๋จธ์ ๋ฌ๋ / ๋ฅ๋ฌ๋ ๊ธฐ๋ณธ
- Backpropagation
- Regression vs. Classification
- Supervised / Unsupervised / Semi-supervised Learning
- Regularziation & Generalization
- Discrimitive model vs. Generative model
- Bias, Variance of Network
- Overfitting vs Underfitting
- Feature space์์ feature ๊ฐ์ distance ์ธก์ ๋ฐฉ๋ฒ
- CNN, RNN, LSTM
- Gradient Descent
- Loss Surface
- Confidence Score Calibration
- PCA
- SVM
- Feature Reduction
- Recptive Field
ํ๋ฅ ํต๊ณ / ์ ํ๋์ ๊ธฐ๋ณธ
- Entropy, Cross-Entropy Loss
- Gaussian Distribution
- Rank of matrix
- Null space
- SVD / Essential matrix์์ SVD ๋ก camera pose ๊ตฌํ๋ ๋ฐฉ๋ฒ
- Vector ๋ด์ , ์ธ์
- ๋ ๋ฒกํฐ์ ๋ด๊ฐ์ ๊ตฌํ๋ ๋ฐฉ๋ฒ
Conventional Computer Vision
- Conventional Vision Feature descriptor - e.g. SIFT, Corner Detector, Edge Detector
- Feature Matching
- Image Filter
- Image Frequency
Deep Learning & Computer Vision
- Image ์์ ํํ ๋ฐฉ๋ฒ - RGB, HSV, YUV
- Inception module
- ResNet, Residual Learning
- Deformable Convolution, Depth-wise separable Convolution, Graph Convolution
- Self-supervised Learning, Contrastive Learning (SimCLR)
- Triplet Loss
- Attention
- LSTM, GRU, Transformer, Vision Transformer
- Transformer -> detection, segmentation์ ์ ์ฉ ๋ฐฉ๋ฒ?
- Transformer ์ฐ์ฐ๋ ํด๊ฒฐ ๋ฐฉ๋ฒ
- Positional Encoding
- Non-local operation
- CLIP Model
- RCNN, Fast RCNN, Mask RCNN, YOLO
- Region of Proposal Network
- Object Detection - Dynamic Head
- Long Tail Problem(Class Imbalance)
- Few shot, Zero shot Learning
- Sham Network
- Object Tracking
- Image Retrieval
- ๋ฅ๋ฌ๋ ๋ชจ๋ธ ์ฌ์ด์ฆ vs ์์ ๋ณต์ก์ฑ
- Continual Learning
- Multi-task Learning
- 6 DoF pose Estimation
- Knowledge Distillation
- Mixup
- Augmentation
- Denosing
- Super Resolution
- Auto Encoder , VAE(Variational Auto Encoder)
- GAN
- AutoML
- MLOps
- ์๊ณ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ. ๊ฑฐ์ continuousํ ์๊ณ์ด ๋ฐ์ดํฐ์ sparseํ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๋ค๋ฅด๊ฒ ์ทจ๊ธํ ๊ฒ์ธ์ง?
3D Computer Vision / Graphics
- Camera Parameter
- Camera Calibration
- Image Transform
- Epipolar Geometry
- Essential matrix, Fundamental matrix
- Essential matrix์์ camera pose ๊ตฌํ๋ ๋ฐฉ๋ฒ?
- Neural Rendering (NeRF)
- Point cloud
- ICP Algorithm
- SLAM / SFM
- Monocular VO(Visual Odometry), multi-camera VO
- Phong Model
- PBR
- Ambient Occlusion
- BRDF
- 3D Reconstruction
- Texture Mapping
- COLMAP / SFM (Structure From Motion)
- Bundle adjustment
- Triangulation
ํ๋ก๊ทธ๋๋ฐ
- C++ STL
- ๋ฆฌ๋ ์ค
- ์๋ฃ๊ตฌ์กฐ
- Overloading, Overriding
- CUDA
- ์๋ฒ ๋๋ ํฌํ
- Rendering code
- Call by value, Call by reference
- Pointer, Smart pointer
- Github ๋ฑ์ ํ์ ํด
- ์ฝ๋๋ฆฌ๋ทฐ
๊ธฐํ
- Image Compression(JPEG, MPEG)
- GIS
- GPS
- ๊ฐ์ฅ ์ต๊ทผ์ ๋ณธ ๋ ผ๋ฌธ์ ์ค๋ช ํด์ฃผ์ธ์
๊ธฐ์ ๊ณผ์
- C++ ์๊ณ ๋ฆฌ์ฆ ์ต์ ํ (๊ฒฐ๊ณผ ๋ฆฌํฌํธ)
- Object Detection, Semenatic Segmentation ๋ฑ์ ๋ฅ๋ฌ๋ task ์ํ. (๊ฒฐ๊ณผ ๋ฆฌํฌํธ ์ ์ถํ๋ ๊ณณ๋ ์๊ณ , + ์บ๊ธ ์ฒ๋ผ ๋ชจ๋ธ ์ ๋ก๋ํด์ ๋ฒค์น๋งํน ํ๋ ๊ณณ๋ ์์