SAM (Segment Anything Model) ์ค๋ช ๋ฐ ์ฌ์ฉ ๋ฐฉ๋ฒ
Meta AI์ Segment Anything Model (SAM)์ด ๊ณต๊ฐ๋์ง ์ผ๋ง๋ ๋๋ค๊ณ ๋ฒ์จ Fast SAM์ด๋ผ๋ ์๋๊ฐ ํฅ์๋ ๋ฒ์ ์ SAM์ด ๊ณต๊ฐ๋์๋ค.
๋น ํ ํฌ ๊ธฐ์ ์์ ํ์ ์ ์ธ AI ๋ชจ๋ธ์ ์ง์์ ์ผ๋ก ๊ณต๊ฐํ๊ณ , ์คํ์์ค ํํ๋ ๋ํ๊ต, ๊ธฐ์ ๋ฑ์์ ๋น ํ ํฌ ๊ธฐ์ ์ AI ๋ชจ๋ธ์ ์์ฉํ ๋ค์ํ AI ๋ชจ๋ธ๊ณผ ๊ธฐ์ ๋ค์ด ๋น ๋ฅด๊ฒ ์์์ ธ ๋์ค๊ณ ์๋ค.
SAM์ iamge segmentation, caption, editing๊ณผ ๊ฐ์ ๊ณ ๊ธ ์์ ์ ๊ธฐ์ด ๋จ๊ณ๊ฐ ๋๊ณ ์์ง๋ง, ๋ง๋ํ ๊ณ์ฐ ๋น์ฉ์ด ๋ฐ์ํ๋ค๋ ๋จ์ ์ด ์๋ค. ๊ณ์ฐ์ ์ฃผ๋ก ๊ณ ํด์๋ ์ ๋ ฅ์ transformer ์ํคํ ์ฒ์์ ๋์จ๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ SAM๊ณผ ๋น์ทํ ์ฑ๋ฅ์ผ๋ก ์๋ ํฅ์ ๋์์ ์ ์ํ๋ค. ๊ธฐ์กด task๋ฅผ segment ์์ฑ ๋ฐ ํ๋กฌํํ ์ผ๋ก ์ฌ๊ตฌ์ฑํ๋ฉด instance segmentation branch๊ฐ ์๋ ์ผ๋ฐ CNN detector๋ก ์ด task๋ฅผ ์ ์ํํ ์ ์๋ค๊ณ ํ๋ค. ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ FastSAM์ ์ฌ์ฉํ๋ฉด SAM๋ณด๋ค 50๋ฐฐ ๋น ๋ฅด์ง๋ง SAM๊ณผ ๋น์ทํ ์ฑ๋ฅ์ ์ป์ ์ ์๋ค๊ณ ํ๋ค.
FastSAM์ AIS(All-instance segmentation)์ PGS(Prompt-Guided Selection)์ผ๋ก ๋๋๋ค. ์ ๋จ๊ณ๋ basis์ด๊ณ ๋ ๋ฒ์งธ ๋จ๊ณ๋ task ์ค์ฌ์ ํ์ฒ๋ฆฌ ๋จ๊ณ๋ผ๊ณ ํ๋ค.
์ ์ํ๋ FastSAM์ YOLACT ๋ฐฉ๋ฒ์ ํ์ฉํ๋ instance segmentation branch๊ฐ ์๋ YOLOv8-seg๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฏธ์ง์ ๋ชจ๋ ๊ฐ์ฒด ๋๋ ์์ญ์ ๋ถํ ํ๋ค. ๊ทธ๋ฐ ๋ค์ ๋ค์ํ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ๊ด์ฌ์๋ ํน์ ๊ฐ์ฒด๋ฅผ ์๋ณํ๋ค. ์ฃผ๋ก point, box, text ํ๋กํํธ๋ฅผ ํ์ฉํ๊ณ , text์ ๊ฒฝ์ฐ CLIP๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค.
๋ํ SAM์์ ์ฌ์ฉํ SA-1B ๋ฐ์ดํฐ์ ์ 2%๋ง์ผ๋ก CNN detector๋ฅผ ํ์ตํ์ฌ SAM๊ณผ ๋น์ทํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ณ ๊ณ์ฐ๋์ ํฌ๊ฒ ๊ฐ์ํ๋ค.
๋ ์์ธํ ๋ด์ฉ์ ๋ ผ๋ฌธ์ ์ฝ์ด๋ณด๋ฉด ์ ์ ์๊ณ , ์ฃผ๋ ์ ์์ ์ Segment Anything ์์ ์ ์ํด transformer๊ฐ ์๋ ๊ฒฝ๋ํ๋ CNN ๊ธฐ๋ฐ์ ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํ์ฌ ์ฑ๋ฅ์ ์ ์งํ๊ณ ๊ณ์ฐ๋์ ํฌ๊ฒ ์ค์๋ค๋ ๊ฒ์ด๋ค. ์ด๋ฅผ ํตํด ๋ณต์กํ ๋น์ ์์ ์์ ๊ฒฝ๋ CNN ๋ชจ๋ธ์ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ์ ์ํ๋ค.
segmentation ๋ชจ๋ธ ์ค๊ณ ์ ๊ฒฝ๋ํ ๋ฐฉ๋ฒ์ ์ฐธ๊ณ ํ๊ธฐ์ ์ข์ ๋ ผ๋ฌธ์ด๋ผ๋ ์๊ฐ์ด ๋ ๋ค.
๋ชจ๋ธ ์ํคํ ์ฒ๋ฅผ ์กฐ๊ธ ๋ ์์ธํ ์ดํด๋ณด๋ฉด...
YOLOv8 ์ํคํ ์ฒ๋ YOLOv5์์ ๋ฐ์ ๋์ด YOLOX, YOLOv6, YOLOv7 ์ ์ฃผ์ ์ค๊ณ ๋ฐฉ๋ฒ์ ํตํฉ๋ ํํ์ด๋ค. YOLOv8์ ๋ฐฑ๋ณธ ๋คํธ์ํฌ์ neck ๋ชจ๋์ YOLOv5์ C3 ๋ชจ๋์ C2f ๋ชจ๋๋ก ๋์ฒดํ๊ณ , ์ ๋ฐ์ดํธ๋ ํค๋ ๋ชจ๋์ anchor-based์์ anchor-free๋ก ์ ํ๋ ํํ๋ผ๊ณ ํ๋ค.
์คํ ๊ฒฐ๊ณผ
์คํ ๊ฒฐ๊ณผ๋ ์ดํด๋ณด๋ฉด SAM์ ๋นํด running speed๊ฐ ํ์คํ ๋นจ๋ผ์ก์ง๋ง ์ฑ๋ฅ์ ๋น์ทํ ๊ฒ์ ํ์ธํ ์ ์๋ค.
๋ํ anomaly detection, salient object segmentation, building extracting ๋ฑ ๋ค์ํ task์ ์๊ฐํ๋ ๊ฒฐ๊ณผ๊ฐ ๊ณต์ ๋์ด ์๋ค.