[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (4) : RetinaNet, EfficientDet
ยท
๐Ÿ› Research/Detection & Segmentation
์•ˆ๋…•ํ•˜์„ธ์š”! ์˜ค๋Š˜์€ ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ์ตœ์‹  ๊ธฐ์ˆ ์ธ RetinaNet๊ณผ EfficientDet์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‘ ๋ชจ๋ธ์€ ๊ฐ๊ฐ์˜ ๋…ํŠนํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ์ •ํ™•๋„์™€ ํšจ์œจ์„ฑ์„ ํ•œ์ธต ๋” ๋Œ์–ด์˜ฌ๋ ธ๋Š”๋ฐ์š”. ๊ฐ ๋ชจ๋ธ์ด ์–ด๋–ค ์ ์—์„œ ๋›ฐ์–ด๋‚œ์ง€, ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๋Š”์ง€ ์ž์„ธํžˆ ์‚ดํŽด๋ณผ๊ฒŒ์š”! ๐Ÿ“Œ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ ์ „์ฒด ํฌ์ŠคํŒ…๋”๋ณด๊ธฐ[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (2) : Fast RCNN, Faster RCNN[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (3) : YOLOv1 ~ YOLOv4[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (4) : RetinaNet, EfficientDet1. RetinaNet:..
[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (3) : YOLOv1 ~ YOLOv4
ยท
๐Ÿ› Research/Detection & Segmentation
์ด์ „ ํฌ์ŠคํŒ…์—์„œ ์‚ดํŽด๋ณธ Faster R-CNN์ด Region Proposal์„ GPU์—์„œ ์ฒ˜๋ฆฌํ•˜๋ฉด์„œ ์‹ค์‹œ๊ฐ„ ๊ฐ์ฒด ๊ฒ€์ถœ์— ๊ฐ€๊นŒ์›Œ์กŒ๋‹ค๋ฉด, YOLO๋Š” ํ•œ ๊ฑธ์Œ ๋” ๋‚˜์•„๊ฐ€ ๊ฐ์ฒด ๊ฒ€์ถœ์„ ์ง„์ •ํ•œ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋งŒ๋“ค์—ˆ์–ด์š”. ์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” YOLO์˜ ๋ฐœ์ „ ๊ณผ์ •์„ ๋ฒ„์ „๋ณ„๋กœ ์‚ดํŽด๋ณด๊ณ , ๊ฐ ๋ฒ„์ „์ด ์–ด๋–ค ๋ฐฉ์‹์œผ๋กœ ์ž‘๋™ํ•˜๋ฉฐ, ์–ด๋–ค ์ฐจ์ด์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€ ์•Œ์•„๋ณด๋ ค๊ณ  ํ•ด์š” ๐Ÿ˜Š ๐Ÿ“Œ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ ์ „์ฒด ํฌ์ŠคํŒ…๋”๋ณด๊ธฐ[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (2) : Fast RCNN, Faster RCNN[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (3) : YOLOv1 ~ YOLOv4[Object Detection] ๊ฐ์ฒด ๊ฒ€..
[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (2) : Fast RCNN, Faster RCNN
ยท
๐Ÿ› Research/Detection & Segmentation
์ง€๋‚œ๋ฒˆ์— ์‚ดํŽด๋ณธ ์ดˆ๊ธฐ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ๋“ค์ด ์ด๋ฏธ์ง€์—์„œ ๊ฐ์ฒด๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ–ˆ๋‹ค๋ฉด, ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ๋Š” ์ด ๊ณผ์ •์„ ๋” ๋น ๋ฅด๊ณ  ํšจ์œจ์ ์œผ๋กœ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์˜€์ฃ . ์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” ์ด๋Ÿฌํ•œ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•œ ๋‘ ๊ฐ€์ง€ ํ˜์‹ ์ ์ธ ๋ชจ๋ธ์ธ Fast RCNN๊ณผ Faster RCNN์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค ํ•ด์š”. Fast RCNN์€ RCNN์˜ ๋Š๋ฆฐ ์†๋„๋ฅผ ๊ฐœ์„ ํ•ด ๊ฐ์ฒด ๊ฒ€์ถœ์„ ํ•œ์ธต ๋น ๋ฅด๊ฒŒ ๋งŒ๋“ค์–ด ์ฃผ์—ˆ๊ณ , Faster RCNN์€ ์ด ๊ณผ์ •์„ GPU๋กœ ๊ฐ€์†ํ™”ํ•ด ์‹ค์‹œ๊ฐ„ ์ฒ˜๋ฆฌ์— ํ•œ ๋ฐœ ๋” ๋‹ค๊ฐ€์„ฐ์–ด์š”. ๋‘ ๋ชจ๋ธ์ด ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๊ณ , ์–ด๋–ค ์ฐจ์ด์ ์ด ์žˆ๋Š”์ง€ ์ž์„ธํžˆ ์‚ดํŽด๋ณด๋ฉด์„œ ๊ฐ์ฒด ๊ฒ€์ถœ ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์„ ํ•จ๊ป˜ ๋”ฐ๋ผ๊ฐ€๋ณด์„ธ์š”! ๐Ÿ˜Š ๐Ÿ“Œ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ ์ „์ฒด ํฌ์ŠคํŒ…๋”๋ณด๊ธฐ[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet[Ob..
[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet
ยท
๐Ÿ› Research/Detection & Segmentation
๊ฐ์ฒด ๊ฒ€์ถœ(Object Detection)์€ ์ปดํ“จํ„ฐ ๋น„์ „ ๋ถ„์•ผ์—์„œ ๊ฐ€์žฅ ๋งŽ์ด ์‚ฌ์šฉ๋˜๋Š” ์ค‘์š”ํ•œ ๊ธฐ์ˆ  ์ค‘ ํ•˜๋‚˜์˜ˆ์š”. ์ด๋ฏธ์ง€๋ฅผ ๋ถ„์„ํ•ด ๊ทธ ์•ˆ์— ์–ด๋–ค ๊ฐ์ฒด๊ฐ€ ์žˆ๋Š”์ง€ ์•Œ์•„๋‚ด๊ณ , ๊ทธ ์œ„์น˜๊นŒ์ง€ ์ •ํ™•ํžˆ ์ฐพ์•„๋‚ด๋Š” ๊ณผ์ •์ด์ฃ . ์ด ๊ธฐ์ˆ ์€ ์ž์œจ์ฃผํ–‰์ฐจ, ์Šค๋งˆํŠธ ์‹œํ‹ฐ, ๋ณด์•ˆ ์‹œ์Šคํ…œ, ์‹ฌ์ง€์–ด๋Š” ์šฐ๋ฆฌ์˜ ์Šค๋งˆํŠธํฐ ์นด๋ฉ”๋ผ๊นŒ์ง€ ๋‹ค์–‘ํ•œ ๊ณณ์—์„œ ํ™œ์šฉ๋˜๊ณ  ์žˆ์–ด์š”. ์˜ค๋Š˜์€ ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ์ดˆ๊ธฐ ๋‹จ๊ณ„์—์„œ ํฐ ์—ญํ• ์„ ํ–ˆ๋˜ ๋‘ ๊ฐ€์ง€ ๋ชจ๋ธ์ธ RCNN๊ณผ SPPNet์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค๊ณ  ํ•ด์š”. ์ด ๋ชจ๋ธ๋“ค์€ ์–ด๋–ป๊ฒŒ ๋™์ž‘ํ•˜๋Š”์ง€, ์–ด๋–ค ์žฅ๋‹จ์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ๊ทธ ๊ณผ์ •์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์ค‘์š”ํ•œ ์šฉ์–ด๋“ค์€ ๋ฌด์—‡์ธ์ง€ ํ•˜๋‚˜์”ฉ ์‚ดํŽด๋ณผ ๊ฑฐ์˜ˆ์š”. ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ๊ธฐ๋ณธ ๊ฐœ๋…์„ ์ดํ•ดํ•˜๊ณ , ๊ธฐ์ˆ ์ด ์–ด๋–ป๊ฒŒ ๋ฐœ์ „ํ•ด์™”๋Š”์ง€ ์•Œ๊ณ  ์‹ถ๋‹ค๋ฉด ์ด๋ฒˆ ํฌ์ŠคํŒ…์ด ํฐ ๋„์›€์ด ๋  ๊ฑฐ์˜ˆ์š”! ๐Ÿ˜Š  ๐Ÿ“Œ ๊ฐ์ฒด ..
[Object Detection] DETR ๋ชจ๋ธ ์ดํ•ดํ•˜๊ธฐ! | End-to-end ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ
ยท
๐Ÿ› Research/Detection & Segmentation
๊ฐ์ฒด ๊ฒ€์ถœ(Object Detection)์€ ์ด๋ฏธ์ง€๋‚˜ ์˜์ƒ์—์„œ ์–ด๋–ค ๊ฐ์ฒด๊ฐ€ ์–ด๋””์— ์žˆ๋Š”์ง€๋ฅผ ์‹๋ณ„ํ•˜๋Š” ์ปดํ“จํ„ฐ ๋น„์ „์˜ ํ•ต์‹ฌ ๊ณผ์ œ ์ค‘ ํ•˜๋‚˜๋‹ค. ์ตœ๊ทผ๊นŒ์ง€๋„ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ์€ R-CNN ๊ณ„์—ด์ด๋‚˜ YOLO ๊ณ„์—ด์ฒ˜๋Ÿผ ๋ณต์žกํ•œ ๊ตฌ์กฐ์™€ ํ›„์ฒ˜๋ฆฌ ๋‹จ๊ณ„๋ฅผ ํฌํ•จํ•œ ๋ฐฉ์‹์ด ์ฃผ๋ฅผ ์ด๋ค˜์ง€๋งŒ, DETR(Detection Transformer)์€ ์ด ํ๋ฆ„์— ํฐ ์ „ํ™˜์ ์„ ๋งŒ๋“ค์–ด๋ƒˆ๋‹ค.DETR์€ Transformer ๊ตฌ์กฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์•ต์ปค ๋ฐ•์Šค ์—†์ด, ํ›„์ฒ˜๋ฆฌ ์—†์ด, ๊ฐ์ฒด ๊ฒ€์ถœ์„ End-to-End๋กœ ํ•™์Šตํ•˜๊ณ  ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“  ๋ชจ๋ธ์ด๋‹ค.1. DETR ํ•ต์‹ฌ ์•„์ด๋””์–ด ๊ธฐ์กด์˜ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ๋“ค์€ ์ˆ˜๋งŽ์€ ์•ต์ปค ๋ฐ•์Šค๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ›„๋ณด ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ๋งŒ๋“ค๊ณ , ๊ทธ ์ค‘์—์„œ ๋†’์€ ํ™•๋ฅ ์„ ๊ฐ€์ง„ ๊ฒƒ๋งŒ ๋‚จ๊ธฐ๋Š” ํ›„์ฒ˜๋ฆฌ ๊ณผ์ •(NMS)์ด ํ•„์š”ํ•˜๋‹ค. ์ด๋Ÿฌํ•œ ๊ณผ์ •์€ ๋ณต์žกํ• ..
[๋…ผ๋ฌธ ๋ฆฌ๋ทฐ] Fast Segment Anything | Fast SAM | SAM์˜ ๊ฒฝ๋Ÿ‰ํ™”
ยท
๐Ÿ› Research/Detection & Segmentation
SAM (Segment Anything Model)  ์„ค๋ช… ๋ฐ ์‚ฌ์šฉ ๋ฐฉ๋ฒ• [Meta AI] SAM (Segment Anything Model) ์‚ฌ์šฉ ๋ฐฉ๋ฒ• | ๋ชจ๋“  ๊ฐ์ฒด๋ฅผ ๋ถ„ํ• ํ•˜๋Š” Vision AI ๋ชจ๋ธSAM (Segment Anything Model) Meta ์—์„œ SAM (Segment Anything Model) ์ด๋ผ๋Š” ์–ด๋–ค ๊ฒƒ์ด๋“  ๋ถ„ํ• ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ๊ณต๊ฐœํ–ˆ๋‹ค. ๋…ผ๋ฌธ ์ œ๋ชฉ ์ž์ฒด๊ฐ€ 'Segment Anything' ์ธ๋ฐ ๊ต‰์žฅํžˆ ์ž์‹ ๊ฐ ๋„˜์น˜๋Š” ์›Œ๋”ฉ์ด๋‹ค. ๊ฐ„๋‹จํ•œ ์„ค๋ช…์„mvje.tistory.com Meta AI์˜ Segment Anything Model (SAM)์ด ๊ณต๊ฐœ๋œ์ง€ ์–ผ๋งˆ๋‚˜ ๋๋‹ค๊ณ  ๋ฒŒ์จ Fast SAM์ด๋ผ๋Š” ์†๋„๊ฐ€ ํ–ฅ์ƒ๋œ ๋ฒ„์ „์˜ SAM์ด ๊ณต๊ฐœ๋˜์—ˆ๋‹ค. ๋น…ํ…Œํฌ ๊ธฐ์—…์—์„œ ํ˜์‹ ์ ์ธ AI ๋ชจ๋ธ์„ ์ง€์†์ ์œผ..