๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
728x90

๐Ÿ› Research/Detection & Segmentation17

[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (4) : RetinaNet, EfficientDet ์•ˆ๋…•ํ•˜์„ธ์š”! ์˜ค๋Š˜์€ ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ์ตœ์‹  ๊ธฐ์ˆ ์ธ RetinaNet๊ณผ EfficientDet์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‘ ๋ชจ๋ธ์€ ๊ฐ๊ฐ์˜ ๋…ํŠนํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ์ •ํ™•๋„์™€ ํšจ์œจ์„ฑ์„ ํ•œ์ธต ๋” ๋Œ์–ด์˜ฌ๋ ธ๋Š”๋ฐ์š”. ๊ฐ ๋ชจ๋ธ์ด ์–ด๋–ค ์ ์—์„œ ๋›ฐ์–ด๋‚œ์ง€, ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๋Š”์ง€ ์ž์„ธํžˆ ์‚ดํŽด๋ณผ๊ฒŒ์š”! ๐Ÿ“Œ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ ์ „์ฒด ํฌ์ŠคํŒ…๋”๋ณด๊ธฐ[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (2) : Fast RCNN, Faster RCNN[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (3) : YOLOv1 ~ YOLOv4[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (4) : RetinaNet, EfficientDet1. RetinaNet:.. 2024. 8. 11.
[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (3) : YOLOv1 ~ YOLOv4 ์ด์ „ ํฌ์ŠคํŒ…์—์„œ ์‚ดํŽด๋ณธ Faster R-CNN์ด Region Proposal์„ GPU์—์„œ ์ฒ˜๋ฆฌํ•˜๋ฉด์„œ ์‹ค์‹œ๊ฐ„ ๊ฐ์ฒด ๊ฒ€์ถœ์— ๊ฐ€๊นŒ์›Œ์กŒ๋‹ค๋ฉด, YOLO๋Š” ํ•œ ๊ฑธ์Œ ๋” ๋‚˜์•„๊ฐ€ ๊ฐ์ฒด ๊ฒ€์ถœ์„ ์ง„์ •ํ•œ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋งŒ๋“ค์—ˆ์–ด์š”. ์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” YOLO์˜ ๋ฐœ์ „ ๊ณผ์ •์„ ๋ฒ„์ „๋ณ„๋กœ ์‚ดํŽด๋ณด๊ณ , ๊ฐ ๋ฒ„์ „์ด ์–ด๋–ค ๋ฐฉ์‹์œผ๋กœ ์ž‘๋™ํ•˜๋ฉฐ, ์–ด๋–ค ์ฐจ์ด์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€ ์•Œ์•„๋ณด๋ ค๊ณ  ํ•ด์š” ๐Ÿ˜Š ๐Ÿ“Œ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ ์ „์ฒด ํฌ์ŠคํŒ…๋”๋ณด๊ธฐ[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (2) : Fast RCNN, Faster RCNN[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (3) : YOLOv1 ~ YOLOv4[Object Detection] ๊ฐ์ฒด ๊ฒ€.. 2024. 8. 11.
[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (2) : Fast RCNN, Faster RCNN ์ง€๋‚œ๋ฒˆ์— ์‚ดํŽด๋ณธ ์ดˆ๊ธฐ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ๋“ค์ด ์ด๋ฏธ์ง€์—์„œ ๊ฐ์ฒด๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ–ˆ๋‹ค๋ฉด, ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ๋Š” ์ด ๊ณผ์ •์„ ๋” ๋น ๋ฅด๊ณ  ํšจ์œจ์ ์œผ๋กœ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์˜€์ฃ . ์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” ์ด๋Ÿฌํ•œ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•œ ๋‘ ๊ฐ€์ง€ ํ˜์‹ ์ ์ธ ๋ชจ๋ธ์ธ Fast RCNN๊ณผ Faster RCNN์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค ํ•ด์š”. Fast RCNN์€ RCNN์˜ ๋Š๋ฆฐ ์†๋„๋ฅผ ๊ฐœ์„ ํ•ด ๊ฐ์ฒด ๊ฒ€์ถœ์„ ํ•œ์ธต ๋น ๋ฅด๊ฒŒ ๋งŒ๋“ค์–ด ์ฃผ์—ˆ๊ณ , Faster RCNN์€ ์ด ๊ณผ์ •์„ GPU๋กœ ๊ฐ€์†ํ™”ํ•ด ์‹ค์‹œ๊ฐ„ ์ฒ˜๋ฆฌ์— ํ•œ ๋ฐœ ๋” ๋‹ค๊ฐ€์„ฐ์–ด์š”. ๋‘ ๋ชจ๋ธ์ด ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๊ณ , ์–ด๋–ค ์ฐจ์ด์ ์ด ์žˆ๋Š”์ง€ ์ž์„ธํžˆ ์‚ดํŽด๋ณด๋ฉด์„œ ๊ฐ์ฒด ๊ฒ€์ถœ ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์„ ํ•จ๊ป˜ ๋”ฐ๋ผ๊ฐ€๋ณด์„ธ์š”! ๐Ÿ˜Š ๐Ÿ“Œ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ ์ „์ฒด ํฌ์ŠคํŒ…๋”๋ณด๊ธฐ[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet[Ob.. 2024. 8. 11.
[Object Detection] ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ (1) : RCNN, SPPNet ๊ฐ์ฒด ๊ฒ€์ถœ(Object Detection)์€ ์ปดํ“จํ„ฐ ๋น„์ „ ๋ถ„์•ผ์—์„œ ๊ฐ€์žฅ ๋งŽ์ด ์‚ฌ์šฉ๋˜๋Š” ์ค‘์š”ํ•œ ๊ธฐ์ˆ  ์ค‘ ํ•˜๋‚˜์˜ˆ์š”. ์ด๋ฏธ์ง€๋ฅผ ๋ถ„์„ํ•ด ๊ทธ ์•ˆ์— ์–ด๋–ค ๊ฐ์ฒด๊ฐ€ ์žˆ๋Š”์ง€ ์•Œ์•„๋‚ด๊ณ , ๊ทธ ์œ„์น˜๊นŒ์ง€ ์ •ํ™•ํžˆ ์ฐพ์•„๋‚ด๋Š” ๊ณผ์ •์ด์ฃ . ์ด ๊ธฐ์ˆ ์€ ์ž์œจ์ฃผํ–‰์ฐจ, ์Šค๋งˆํŠธ ์‹œํ‹ฐ, ๋ณด์•ˆ ์‹œ์Šคํ…œ, ์‹ฌ์ง€์–ด๋Š” ์šฐ๋ฆฌ์˜ ์Šค๋งˆํŠธํฐ ์นด๋ฉ”๋ผ๊นŒ์ง€ ๋‹ค์–‘ํ•œ ๊ณณ์—์„œ ํ™œ์šฉ๋˜๊ณ  ์žˆ์–ด์š”. ์˜ค๋Š˜์€ ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ์ดˆ๊ธฐ ๋‹จ๊ณ„์—์„œ ํฐ ์—ญํ• ์„ ํ–ˆ๋˜ ๋‘ ๊ฐ€์ง€ ๋ชจ๋ธ์ธ RCNN๊ณผ SPPNet์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค๊ณ  ํ•ด์š”. ์ด ๋ชจ๋ธ๋“ค์€ ์–ด๋–ป๊ฒŒ ๋™์ž‘ํ•˜๋Š”์ง€, ์–ด๋–ค ์žฅ๋‹จ์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ๊ทธ ๊ณผ์ •์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์ค‘์š”ํ•œ ์šฉ์–ด๋“ค์€ ๋ฌด์—‡์ธ์ง€ ํ•˜๋‚˜์”ฉ ์‚ดํŽด๋ณผ ๊ฑฐ์˜ˆ์š”. ๊ฐ์ฒด ๊ฒ€์ถœ์˜ ๊ธฐ๋ณธ ๊ฐœ๋…์„ ์ดํ•ดํ•˜๊ณ , ๊ธฐ์ˆ ์ด ์–ด๋–ป๊ฒŒ ๋ฐœ์ „ํ•ด์™”๋Š”์ง€ ์•Œ๊ณ  ์‹ถ๋‹ค๋ฉด ์ด๋ฒˆ ํฌ์ŠคํŒ…์ด ํฐ ๋„์›€์ด ๋  ๊ฑฐ์˜ˆ์š”! ๐Ÿ˜Š  ๐Ÿ“Œ ๊ฐ์ฒด .. 2024. 8. 11.
[Object Detection] DETR ๋ชจ๋ธ ์™„์ „ ์ •๋ณตํ•˜๊ธฐ !! | End-to-end ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ ๊ฐ์ฒด ๊ฒ€์ถœ(Object Detection)์€ ์ปดํ“จํ„ฐ ๋น„์ „ ๋ถ„์•ผ์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๋ฌธ์ œ ์ค‘ ํ•˜๋‚˜๋กœ, ์ด๋ฏธ์ง€ ๋‚ด์—์„œ ๊ฐ์ฒด์˜ ์œ„์น˜์™€ ์ข…๋ฅ˜๋ฅผ ์‹๋ณ„ํ•˜๋Š” ์ž‘์—…์ด์—์š”. ์˜ค๋Š˜์€ ๊ฐ์ฒด ๊ฒ€์ถœ ๋ถ„์•ผ์—์„œ ํ•œ ํš์„ ๊ทธ์€ DETR (Detection Transformer) ๋ชจ๋ธ์— ๋Œ€ํ•ด ์‚ดํŽด๋ณด๋ ค ํ•ด์š”. ์–ด๋–ค ๊ฒƒ์„ ์œ„์ฃผ๋กœ ๋ด์•ผํ• ์ง€ ๋ชจ๋ฅด๊ฒ ๋‹ค๋ฉด, 1) ํŠธ๋žœ์Šคํฌ๋จธ ๋””์ฝ”๋”, 2) ์˜ค๋ธŒ์ ํŠธ ์ฟผ๋ฆฌ, 3) ํ—๊ฐ€๋ฆฌ์•ˆ ๋งค์นญ ์„ ์œ„์ฃผ๋กœ ๋ณด์‹œ๋ฉด ๋ผ์š”-! Transformer ๊ธฐ๋ณธ ๊ตฌ์กฐ์™€ ์—ญํ•  ๋ฐ self-attention ์— ๋Œ€ํ•ด์„œ ์•Œ๊ณ  ์žˆ๋Š” ์ƒํƒœ์—์„œ ๋ณด์‹œ๋Š”๊ฒŒ ์ข‹์•„์š”.๋˜ํ•œ ํ˜„์žฌ๋Š” ๊ธฐ๋ณธ DETR ๋ชจ๋ธ๋ณด๋‹ค๋Š” DETR ๊ธฐ๋ฐ˜์˜ ์กฐ๊ธˆ ๋” ๋ฐœ์ „๋œ ํ˜•ํƒœ์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋‹ˆ, ์ฐธ๊ณ  ๋ถ€ํƒ๋“œ๋ ค์š”.1. ์ธํŠธ๋กœ DETR์€ Transformer ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์ตœ์ดˆ์˜ ๊ฐ์ฒด .. 2024. 8. 10.
[๋…ผ๋ฌธ ๋ฆฌ๋ทฐ] Fast Segment Anything | Fast SAM | SAM์˜ ๊ฒฝ๋Ÿ‰ํ™” SAM (Segment Anything Model) ์„ค๋ช… ๋ฐ ์‚ฌ์šฉ ๋ฐฉ๋ฒ• [Meta AI] SAM (Segment Anything Model) ์‚ฌ์šฉ ๋ฐฉ๋ฒ• | ๋ชจ๋“  ๊ฐ์ฒด๋ฅผ ๋ถ„ํ• ํ•˜๋Š” Vision AI ๋ชจ๋ธ SAM (Segment Anything Model) Meta ์—์„œ SAM (Segment Anything Model) ์ด๋ผ๋Š” ์–ด๋–ค ๊ฒƒ์ด๋“  ๋ถ„ํ• ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ๊ณต๊ฐœํ–ˆ๋‹ค. ๋…ผ๋ฌธ ์ œ๋ชฉ ์ž์ฒด๊ฐ€ 'Segment Anything' ์ธ๋ฐ ๊ต‰์žฅํžˆ ์ž์‹ ๊ฐ ๋„˜์น˜๋Š” ์›Œ๋”ฉ์ด๋‹ค. ๊ฐ„๋‹จํ•œ ์„ค๋ช…์„ mvje.tistory.com Meta AI์˜ Segment Anything Model (SAM)์ด ๊ณต๊ฐœ๋œ์ง€ ์–ผ๋งˆ๋‚˜ ๋๋‹ค๊ณ  ๋ฒŒ์จ Fast SAM์ด๋ผ๋Š” ์†๋„๊ฐ€ ํ–ฅ์ƒ๋œ ๋ฒ„์ „์˜ SAM์ด ๊ณต๊ฐœ๋˜์—ˆ๋‹ค. ๋น…ํ…Œํฌ ๊ธฐ์—…์—์„œ ํ˜์‹ ์ ์ธ AI ๋ชจ๋ธ์„ ์ง€์†์ .. 2023. 7. 2.
728x90