์๋ ํ์ธ์! ์ค๋์ ๊ฐ์ฒด ๊ฒ์ถ์ ์ต์ ๊ธฐ์ ์ธ RetinaNet๊ณผ EfficientDet์ ๋ํด ์์๋ณด๋ ค๊ณ ํฉ๋๋ค. ์ด ๋ ๋ชจ๋ธ์ ๊ฐ๊ฐ์ ๋ ํนํ ๋ฐฉ์์ผ๋ก ๊ฐ์ฒด ๊ฒ์ถ์ ์ ํ๋์ ํจ์จ์ฑ์ ํ์ธต ๋ ๋์ด์ฌ๋ ธ๋๋ฐ์. ๊ฐ ๋ชจ๋ธ์ด ์ด๋ค ์ ์์ ๋ฐ์ด๋์ง, ์ด๋ป๊ฒ ์๋ํ๋์ง ์์ธํ ์ดํด๋ณผ๊ฒ์!
๐ ๊ฐ์ฒด ๊ฒ์ถ ๋ชจ๋ธ ์ ์ฒด ํฌ์คํ
1. RetinaNet: ํด๋์ค ๋ถ๊ท ํ ํด๊ฒฐ
๋จผ์ ์๊ฐํ ๋ชจ๋ธ์ RetinaNet์ ๋๋ค. RetinaNet์ 2017๋ ์ ๋ฐํ๋ ๋ชจ๋ธ๋ก, ๊ฐ์ฒด ๊ฒ์ถ์์ ํํ ๋ฐ์ํ๋ ํด๋์ค ๋ถ๊ท ํ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๊ธฐ ์ํด Focal Loss๋ผ๋ ํ์ ์ ์ธ ์์ค ํจ์๋ฅผ ๋์ ํ์ด์.
์๋ ๋ฐฉ์
- Feature Pyramid Network (FPN)
- RetinaNet์ Feature Pyramid Network (FPN)์ ํ์ฉํด ๋ค์ํ ์ค์ผ์ผ์ ๊ฐ์ฒด๋ฅผ ๊ฒ์ถํด์.
- ์ฌ๋ฌ ํด์๋์ feature map์ ์ฌ์ฉํด ์์ ๊ฐ์ฒด๋ถํฐ ํฐ ๊ฐ์ฒด๊น์ง ์ ์ก์๋ผ ์ ์์ด์.
- Focal Loss
- Focal Loss๋ ํด๋์ค ๋ถ๊ท ํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๊ธฐ ์ํด ์ค๊ณ๋ Loss ํจ์์์
- ์ฝ๊ฒ ๋ถ๋ฅ๋๋ ์ํ(์ ํ๋๊ฐ ๋์ ์ํ)์๋ ๋ ์ ์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๊ณ , ์ด๋ ค์ด ์ํ(์ ํ๋๊ฐ ๋ฎ์ ์ํ)์๋ ๋ ๋ง์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ์ฌ ๋๋ฌธ ๊ฐ์ฒด๋ ์์ ๊ฐ์ฒด์ ๊ฒ์ถ ์ฑ๋ฅ์ ๋์ฌ์ค์.
- ๋๋ถ์ ๋ฐฐ๊ฒฝ๊ณผ ๊ฒน์น๋ ๊ฐ์ฒด๋ ์ ํํ๊ฒ ์ก์ ์ ์์ฃ .
- Single Shot Detection
- RetinaNet์ Single Shot ๋ฐฉ์์ผ๋ก ์๋ํฉ๋๋ค.
- ์ฆ, ์ด๋ฏธ์ง๋ฅผ ํ ๋ฒ์ ๋ถ์ํด ๋น ๋ฅด๊ฒ ๊ฐ์ฒด๋ฅผ ๊ฒ์ถํ ์ ์์ด ์ค์๊ฐ ๊ฒ์ถ์๋ ์ ํฉํด์.
๋จ์
- ์๋: RetinaNet์ ๋์ ์ ํ๋๋ฅผ ์๋ํ์ง๋ง, ์๋ ๋ฉด์์๋ YOLO์ SSD ๊ฐ์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ๋นํด ์๋์ ์ผ๋ก ๋๋ฆด ์ ์์ต๋๋ค. ๋ณต์กํ ์ฅ๋ฉด์์ ์๋๊ฐ ๋จ์ด์ง ์ ์์ฃ .
- ํ๋ จ ๋ณต์ก์ฑ: Focal Loss๋ ๋งค์ฐ ํจ๊ณผ์ ์ด์ง๋ง, ํ์ต ๊ณผ์ ์์์ ํ๋ผ๋ฏธํฐ ์กฐ์ ๊ณผ ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ด ๋ณต์กํ ์ ์์ด์.
2. EfficientDet: ์ ํ๋์ ํจ์จ์ฑ ํฅ์
๋ค์์ผ๋ก ์๊ฐํ ๋ชจ๋ธ์ EfficientDet์ ๋๋ค. EfficientDet์ 2020๋ ์ ๋ฐํ๋ ๋ชจ๋ธ๋ก, EfficientNet์ ๋ฐฑ๋ณธ์ผ๋ก ์ฌ์ฉํ์ฌ ์ ํ๋์ ํจ์จ์ฑ์ ๋์์ ๋์์ด์.
์๋ ๋ฐฉ์
- EfficientNet Backbone
- EfficientDet์ EfficientNet์ ๋ฐฑ๋ณธ ๋คํธ์ํฌ๋ก ์ฌ์ฉํด์
- ์ด ๋คํธ์ํฌ๋ ๋ชจ๋ธ์ ๊น์ด์ ํญ์ ์ต์ ํํ์ฌ, ๋์ ์ฑ๋ฅ์ ์ ์งํ๋ฉด์๋ ์ ์ ์ฐ์ฐ ์์์ ์๋ชจํด์.
- EfficientNet์ ๊ธฐ๋ณธ ๋คํธ์ํฌ๋ MobileNetV2๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฉฐ, Depthwise Separable Convolutions๋ฅผ ์ฌ์ฉํ์ฌ ์ฐ์ฐ๋์ ์ค์ฌ์.
- BiFPN (Bidirectional Feature Pyramid Network)
- BiFPN์ ์๋ฐฉํฅ์ผ๋ก feature๋ฅผ ๊ฒฐํฉํ์ฌ ๋ค์ํ ์ค์ผ์ผ์ ๊ฐ์ฒด๋ฅผ ๋์ฑ ์ ํํ๊ฒ ๊ฐ์งํ ์ ์๊ฒ ํด์.
- ์ด ๊ตฌ์กฐ ๋๋ถ์ ์ฌ๋ฌ ํด์๋์ feature๋ฅผ ์ ํตํฉํ ์ ์์ต๋๋ค.
- Compound Scaling
- EfficientDet์ Compound Scaling ๊ธฐ๋ฒ์ ํตํด ๋ชจ๋ธ์ ํฌ๊ธฐ์ ๋ณต์ก์ฑ์ ์กฐ์ ํ ์ ์์ด์.
- ์ด๋ฅผ ํตํด ์ฑ๋ฅ๊ณผ ์ฐ์ฐ ์์ ์ฌ์ด์ ๊ท ํ์ ๋ง์ถ ์ ์์ต๋๋ค.
๋จ์
- ๋ณต์กํ ๊ตฌ์กฐ: EfficientDet์ ๊ตฌ์กฐ๋ ๋ค์ ๋ณต์กํ๊ณ , ๊ตฌํ๊ณผ ํ๋์ด ์ด๋ ค์ธ ์ ์์ต๋๋ค. ํนํ ๋ค์ํ ํ๊ฒฝ์์ ์ต์ ์ ์ฑ๋ฅ์ ์ป๊ธฐ ์ํด์๋ ์ ์คํ ์กฐ์ ์ด ํ์ํด์.
- ํ๋์จ์ด ์๊ตฌ์ฌํญ: ํจ์จ์ฑ์ ๋์ด๊ธฐ ์ํด ๊ฐ๋ ฅํ ํ๋์จ์ด๊ฐ ํ์ํ ์ ์์ต๋๋ค. ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์์ ํ์ต ์์๋ ๋์ ์ฌ์์ GPU๊ฐ ์๊ตฌ๋ ์ ์์ด์.
RetinaNet๊ณผ EfficientDet์ ๊ฐ์ฒด ๊ฒ์ถ ๋ถ์ผ์์ ํฐ ํ์ ์ ์ผ์ผํจ ๋ชจ๋ธ๋ค์ ๋๋ค. RetinaNet์ Focal Loss๋ฅผ ํตํด ํด๋์ค ๋ถ๊ท ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ , ์์ ๊ฐ์ฒด๋ ๋๋ฌธ ๊ฐ์ฒด์ ๊ฒ์ถ์์ ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ฉฐ, EfficientDet์ EfficientNet๊ณผ BiFPN์ ํ์ฉํ์ฌ ์ ํ๋์ ํจ์จ์ฑ์ ๋์์ ๋์์ด์.
๊ฒ์ถ ๋ชจ๋ธ๋ค์ ์ฅ์ ๊ณผ ๋จ์ ์ ์ ์ดํดํ๋ฉด, ํน์ ๋ฐ์ดํฐ์ ์ด๋ ์ํฉ์ ๋ง๋ ์ต์ ์ ๋ชจ๋ธ์ ์ ํํ๋ ๋ฐ ํฐ ๋์์ด ๋ ๊ฑฐ์์. ๋ค์ ๋ฒ์๋ ์๋ก์ด ๊ฐ์ฒด ๊ฒ์ถ ๋ชจ๋ธ ์๊ฐ๋ก ๋์์ฌ๊ฒ์ !