[๊ฐ์ฒด ๊ฒ€์ถœ] ์•ต์ปค ๋ฐ•์Šค(Anchor Box)๋ž€ ๋ฌด์—‡์ธ๊ฐ€? | ๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ์—์„œ์˜ ์—ญํ• ๊ณผ ํ•œ๊ณ„
ยท
๐Ÿ“– Fundamentals/Computer Vision
๊ฐ์ฒด ๊ฒ€์ถœ(Object Detection) ๋ชจ๋ธ์—์„œ๋Š” ์ด๋ฏธ์ง€ ์† ๊ฐ์ฒด์˜ ์œ„์น˜์™€ ํฌ๊ธฐ๋ฅผ ์˜ˆ์ธกํ•ด์•ผ ํ•œ๋‹ค. ์ด๋•Œ ์‚ฌ์šฉ๋˜๋Š” ์ค‘์š”ํ•œ ๊ฐœ๋… ์ค‘ ํ•˜๋‚˜๊ฐ€ ์•ต์ปค ๋ฐ•์Šค(Anchor Box)์ด๋‹ค. 1. ์•ต์ปค ๋ฐ•์Šค๋ž€? ์•ต์ปค ๋ฐ•์Šค๋Š” ์ด๋ฏธ์ง€์˜ ๊ฐ ์œ„์น˜์— ๋ฏธ๋ฆฌ ์ •์˜๋œ ์—ฌ๋Ÿฌ ํฌ๊ธฐ์™€ ๋น„์œจ์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ๋ชจ๋ธ์€ ์ด ์•ต์ปค ๋ฐ•์Šค๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์‹ค์ œ ๊ฐ์ฒด์˜ ์œ„์น˜์™€ ํด๋ž˜์Šค ์ •๋ณด๋ฅผ ์˜ˆ์ธกํ•œ๋‹ค. ๋‹ค์–‘ํ•œ ํฌ๊ธฐ์˜ ๊ฐ์ฒด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํƒ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์•ต์ปค ๋ฐ•์Šค๋ฅผ ๊ฐ ์œ„์น˜๋งˆ๋‹ค ๋ฐฐ์น˜ํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. 2. ์•ต์ปค ๋ฐ•์Šค์˜ ์›๋ฆฌ์™€ ์‚ฌ์šฉ ๋ฐฉ์‹๊ฐ์ฒด ๊ฒ€์ถœ ๋ชจ๋ธ์€ ๊ฐ ์•ต์ปค ๋ฐ•์Šค์— ๋Œ€ํ•ด ๋‘ ๊ฐ€์ง€๋ฅผ ์˜ˆ์ธกํ•œ๋‹ค.ํ•ด๋‹น ๋ฐ•์Šค์— ์–ด๋–ค ํด๋ž˜์Šค๊ฐ€ ์กด์žฌํ•˜๋Š”์ง€ํ•ด๋‹น ๋ฐ•์Šค๋ฅผ ์–ด๋–ป๊ฒŒ ์กฐ์ •ํ•ด์•ผ ์‹ค์ œ ๊ฐ์ฒด์˜ ์œ„์น˜์™€ ๋งž์ถœ ์ˆ˜ ์žˆ๋Š”์ง€์ด๋•Œ, ์˜ˆ์ธก๋œ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๊ฐ€ ์‹ค์ œ ๊ฐ์ฒด์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค์™€ ..
Equirectangular Image (๋“ฑ์žฅ๋ฐฉํ˜• ์ด๋ฏธ์ง€) ์„ค๋ช… | ์ด๋ฏธ์ง€ ์ขŒํ‘œ ๋ณ€ํ™˜ | ๊ตฌ๋ฉด์ขŒํ‘œ ๋ฒกํ„ฐ ๊ณ„์‚ฐ
ยท
๐Ÿ“– Fundamentals/Computer Vision
Equirectangular image (๋“ฑ์žฅ๋ฐฉํ˜• ์ด๋ฏธ์ง€) Equirectangular image๋Š” ๊ตฌ๋ฉด ์ขŒํ‘œ๊ณ„๋ฅผ ์ง๊ฐ ์ขŒํ‘œ๊ณ„๋กœ ๋งคํ•‘ํ•œ ์ด๋ฏธ์ง€์ž…๋กœ ๊ตฌ๋ฉด ์ขŒํ‘œ๊ณ„์˜ ๊ฐ๋„๋ฅผ ์ง๊ฐ ์ขŒํ‘œ๊ณ„์˜ ํ”ฝ์…€๋กœ ์ผ๋Œ€์ผ ๋งคํ•‘ํ•˜์—ฌ ํ‘œํ˜„ํ•œ๋‹ค. ๊ตฌ๋ฉด ์ขŒํ‘œ๊ณ„์—์„œ๋Š” ์œ„๋„(latitude)์™€ ๊ฒฝ๋„(longitude)๋กœ ์ด๋ฏธ์ง€๋ฅผ ํ‘œํ˜„ํ•˜๋Š”๋ฐ, ์œ„๋„๋Š” ๊ตฌ์˜ ์ˆ˜ํ‰ ๋ฐฉํ–ฅ์„ ๋‚˜ํƒ€๋‚ด๋ฉฐ, -90์—์„œ 90๋„๊นŒ์ง€์˜ ๋ฒ”์œ„๋ฅผ ๊ฐ€์ง€๊ณ  ๊ฒฝ๋„๋Š” ๊ตฌ์˜ ์ˆ˜์ง ๋ฐฉํ–ฅ์„ ๋‚˜ํƒ€๋‚ด๋ฉฐ, -180์—์„œ 180๋„๊นŒ์ง€์˜ ๋ฒ”์œ„๋ฅผ ๊ฐ€์ง„๋‹ค. Equirectangular ์ด๋ฏธ์ง€๋Š” ์ด๋Ÿฌํ•œ ๊ตฌ๋ฉด ์ขŒํ‘œ๊ณ„๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ํ‘œํ˜„ํ•œ๋‹ค. ์ด๋ฏธ์ง€์˜ ๋„ˆ๋น„๋Š” 360๋„์˜ ๊ฒฝ๋„ ๋ฒ”์œ„์— ๋งคํ•‘๋˜๊ณ , ๋†’์ด๋Š” -90์—์„œ 90๋„์˜ ์œ„๋„ ๋ฒ”์œ„์— ๋งคํ•‘๋œ๋‹ค. ๋”ฐ๋ผ์„œ ์ด๋ฏธ์ง€์˜ ํฌ๊ธฐ๋Š” ๊ฒฝ๋„์™€ ์œ„๋„์˜ ํ•ด์ƒ๋„์— ๋”ฐ๋ผ ๊ฒฐ์ •๋œ๋‹ค. ์ด..
์ง๊ฐ์ขŒํ‘œ๊ณ„ & ๊ตฌ๋ฉด์ขŒํ‘œ๊ณ„ | ์ขŒํ‘œ ๋ณ€ํ™˜
ยท
๐Ÿ“– Fundamentals/Computer Vision
์ง๊ฐ ์ขŒํ‘œ๊ณ„์™€ ๊ตฌ๋ฉด ์ขŒํ‘œ๊ณ„๋Š” ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ๋ฐ ๋ถ„์„์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์ขŒํ‘œ ์‹œ์Šคํ…œ์ด๋‹ค. ์ง๊ฐ ์ขŒํ‘œ๊ณ„(Rectangular Coordinates) ์ด๋ฏธ์ง€๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ์ขŒํ‘œ ์‹œ์Šคํ…œ ์ด๋ฏธ์ง€๋Š” ํ”ฝ์…€๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์œผ๋ฉฐ, ๊ฐ ํ”ฝ์…€์€ ํ–‰(row)๊ณผ ์—ด(column)์˜ ์ธ๋ฑ์Šค๋กœ ํ‘œํ˜„ ์ผ๋ฐ˜์ ์œผ๋กœ ์™ผ์ชฝ ์ƒ๋‹จ ๋ชจ์„œ๋ฆฌ๊ฐ€ (0, 0)์œผ๋กœ ์‹œ์ž‘ํ•˜์—ฌ ์˜ค๋ฅธ์ชฝ์œผ๋กœ ๊ฐˆ์ˆ˜๋ก ์—ด(column)์ด ์ฆ๊ฐ€ํ•˜๊ณ  ์•„๋ž˜๋กœ ๊ฐˆ์ˆ˜๋ก ํ–‰(row)์ด ์ฆ๊ฐ€ ๊ตฌ๋ฉด ์ขŒํ‘œ๊ณ„(Spherical Coordinates) ๊ตฌ๋ฉด ์ขŒํ‘œ๊ณ„๋Š” ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ์—์„œ ์ฃผ๋กœ ์‚ฌ์šฉ๋˜์ง€๋Š” ์•Š์ง€๋งŒ, ์ปดํ“จํ„ฐ ๋น„์ „์˜ ํŠน์ • ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์Œ ์ฃผ๋กœ 3D ๊ณต๊ฐ„์—์„œ ์‚ฌ์šฉ๋˜๋ฉฐ, ์œ„๋„(latitude), ๊ฒฝ๋„(longitude), ๊ณ ๋„(altitude)์™€ ๊ฐ™์€ ์ขŒํ‘œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ง€๊ตฌ ํ‘œ..
[๊ฐ์ฒด ๊ฒ€์ถœ] RPN์ด ๋ฌด์—‡์ผ๊นŒ? | ๊ฐ์ฒด ๊ฒ€์ถœ์—์„œ ํ›„๋ณด ์˜์—ญ์„ ์ƒ์„ฑํ•˜๋Š” ๋„คํŠธ์›Œํฌ | Region Proposal Network ์„ค๋ช…
ยท
๐Ÿ“– Fundamentals/Computer Vision
RPN(Region Proposal Network)์€ Faster R-CNN(Region-based Convolutional Neural Network) ๋ชจ๋ธ์—์„œ ์ œ์•ˆ๋œ ๋„คํŠธ์›Œํฌ๋กœ, ๊ฐ์ฒด ๊ฒ€์ถœ์—์„œ ํ›„๋ณด ์˜์—ญ(proposal)์„ ์ƒ์„ฑํ•˜๋Š” ์—ญํ• ์„ ํ•œ๋‹ค. Faster R-CNN์€ ๋ฌผ์ฒด์˜ ์œ„์น˜๋ฅผ ์ฐพ๋Š” RPN๊ณผ ๋ฌผ์ฒด๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ณ  ์ •ํ™•ํ•œ ์œ„์น˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ํ›„์† ๋„คํŠธ์›Œํฌ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค.RPN์˜ ์ฃผ์š” ํŠน์ง• ๋ฐ ๊ณผ์ •์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ๋ชฉ์  : RPN์˜ ์ฃผ๋œ ๋ชฉ์ ์€ ์ด๋ฏธ์ง€์—์„œ ๋ฌผ์ฒด๊ฐ€ ์žˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ๋Š” ์œ„์น˜๋ฅผ ์ฐพ์•„๋‚ด์–ด ํ›„์† ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ํ›„๋ณด ์˜์—ญ์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ Anchor Boxes : RPN์€ ๊ฐ ์œ„์น˜์—์„œ ์—ฌ๋Ÿฌ ํฌ๊ธฐ์™€ ์ข…ํšก๋น„๋ฅผ ๊ฐ€์ง€๋Š” ์ผ๋ จ์˜ anchor boxes๋ฅผ ์ •์˜ํ•˜๊ณ , ์ด anchor boxes๋Š” ๋ฌผ์ฒด์˜ ์œ„์น˜์™€ ํฌ๊ธฐ์— ๋Œ€..
[๊ฐ์ฒด ๊ฒ€์ถœ] NMS๊ฐ€ ๋ฌด์—‡์ผ๊นŒ? | ๊ฐ์ฒด ๊ฒ€์ถœ์—์„œ ๊ฒน์น˜๋Š” bbox๋ฅผ ์ œ๊ฑฐํ•˜๋Š” ๋ฐฉ๋ฒ• | Non-Maximum Suppression ์„ค๋ช…
ยท
๐Ÿ“– Fundamentals/Computer Vision
Non-Maximum Suppression(NMS)์€ ๊ฐ์ฒด ๊ฐ์ง€ ๋ชจ๋ธ์—์„œ ๊ฒน์น˜๋Š” Bounding Box๋ฅผ ์ œ๊ฑฐํ•˜์—ฌ ์ตœ์ข… ๊ฒฐ๊ณผ๋ฅผ ์ •๋ฆฌํ•˜๋Š” ๊ธฐ์ˆ ์ด๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ํ•˜๊ณ  ์ค‘๋ณต๋œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ฑฐํ•จ์œผ๋กœ์จ ์ •ํ™•ํ•œ ๊ฐ์ฒด ๊ฐ์ง€๋ฅผ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.  NMS์˜ ์›๋ฆฌ๋Š” ์—ฌ๋Ÿฌ ํ›„๋ณด bbox ์ค‘์—์„œ ๊ฒน์น˜๋Š” ์ƒ์ž๋“ค์„ ํ•„ํ„ฐ๋งํ•˜๋Š” ๊ฒƒ์ธ๋ฐ, ๊ฒน์น˜๋Š” ์ƒ์ž๋“ค ์ค‘์—์„œ ๊ฐ€์žฅ ํ™•๋ฅ ์ด ๋†’์€ ์ƒ์ž๋ฅผ ์„ ํƒํ•˜๊ณ  ๊ทธ์™€ ๊ฒน์น˜๋Š” ์ƒ์ž๋“ค์„ ์ œ๊ฑฐํ•˜๋Š” ๋ฐฉ์‹์ด๋ผ๊ณ  ๋ณด๋ฉด ๋œ๋‹ค. ์ด๋Ÿฌํ•œ NMS๋Š” ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ์ •๋ฆฌํ•˜๊ณ  ์ค‘๋ณต๋œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ฑฐํ•˜์—ฌ ๋” ์ •ํ™•ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋ฉฐ ํŠนํžˆ, ํ•œ ๊ฐ์ฒด์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ฒน์น˜๋Š” ๊ฒฝ๊ณ„ ์ƒ์ž๊ฐ€ ์ƒ์„ฑ๋œ ๊ฒฝ์šฐ ์ด๋ฅผ ์ •๋ฆฌํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. Object Detection ๋ชจ๋ธ ์ค‘ Faster R-CNN, YOLO..
Computer Vision (์ปดํ“จํ„ฐ ๋น„์ „) ์ด ๋ฌด์—‡์ผ๊นŒ !?
ยท
๐Ÿ“– Fundamentals/Computer Vision
Computer Vision (์ปดํ“จํ„ฐ ๋น„์ „) ์ปดํ“จํ„ฐ ๋น„์ „(Computer Vision)์€ ๋ง ๊ทธ๋Œ€๋กœ ์ปดํ“จํ„ฐ๊ฐ€ '์‹œ๊ฐ'์„ ๊ฐ€์ง€๊ฒŒ ํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”. ์‰ฝ๊ฒŒ ๋งํ•ด, ์šฐ๋ฆฌ๊ฐ€ ๋ˆˆ์œผ๋กœ ์„ธ์ƒ์„ ๋ณด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, ์ปดํ“จํ„ฐ๊ฐ€ ์ด๋ฏธ์ง€๋‚˜ ๋™์˜์ƒ์„ ํ†ตํ•ด ์ฃผ๋ณ€ ํ™˜๊ฒฝ์„ ์ธ์‹ํ•˜๊ณ  ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“œ๋Š” ๊ธฐ์ˆ ์ด์ฃ . ์˜ˆ์ „์—๋Š” ๋‹จ์ˆœํžˆ ์นด๋ฉ”๋ผ๋กœ ์ฐ์€ ์‚ฌ์ง„์ด๋‚˜ ์˜์ƒ์„ ์ €์žฅํ•˜๊ณ  ๋ณด๋Š” ๊ฒƒ์— ๊ทธ์ณค๋‹ค๋ฉด, ์ด์ œ๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ๊ทธ ์ด๋ฏธ์ง€์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•ด ๋‚ด๊ณ , ๋ถ„์„ํ•˜๊ณ , ํŒ๋‹จ๊นŒ์ง€ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์–ด์š”. ์•„, ์ด์ œ๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ๋„ ํ•˜์ฃ ! ์ด๋Ÿฌํ•œ ์ปดํ“จํ„ฐ ๋น„์ „์€ ๊ฒฐ๋ก ์ ์œผ๋กœ ์ปดํ“จํ„ฐ๊ฐ€ ์ธ๊ฐ„์˜ ์‹œ๊ฐ์  ์ง€๊ฐ ๋Šฅ๋ ฅ์„ ๋ชจ๋ฐฉํ•˜๊ณ  ์ธ๊ฐ„์„ ๋›ฐ์–ด๋„˜๋Š” ์‹œ๊ฐ์  ์ง€๋Šฅ์„ ๊ฐ–๋Š” ๊ฒƒ์„ ์ง€ํ–ฅํ•˜๋ฉฐ ์ž์œจ ์ฃผํ–‰, ์˜๋ฃŒ ์˜์ƒ, ์ด๋ฏธ์ง€ ๊ฒ€์ƒ‰, ์–ผ๊ตด ์ธ์‹ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ํ™œ์šฉ๋˜๊ณ  ์žˆ์–ด..