๋ณธ ๋ ผ๋ฌธ์ 2013๋ , International journal of computer vision ์ ๋์ ๊ฒ์ฌ๋ ๋ ผ๋ฌธ์ ๋๋ค.
๊ฑฐ์ 10๋ ์ ๋ ผ๋ฌธ์ด์ง๋ง, ์ ์๊ฒ material recognition์ด๋ผ๋ ๋ถ์ผ๋ฅผ ๊ฐ์ฅ ์ ์ดํดํ ์ ์๊ฒ ํด์ค ๋ ผ๋ฌธ์ด๊ธฐ์ ์ ๋ฆฌํด๋๋ ค ํฉ๋๋ค.
Introduction
๋ณธ ๋ ผ๋ฌธ์์๋ human material recognition ์ฐ๊ตฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ low, mid-level ์ด๋ฏธ์ง feature๋ฅผ ์ ์ํ๊ณ SVM classifier ๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฌํ feature๋ค์ ๊ฒฐํฉํฉ๋๋ค.
์๋์๋ ์ฌ์ง ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๋ถ๋ฅํ๊ธฐ ์ํ ๋ช๊ฐ์ง ํน์ฑ๋ค์ ์๊ฐํฉ๋๋ค.
- Surface Reflectance
Surface reflectance๋ ์ฌ์ง ์ข ๋ฅ์ ์๊ด๊ด๊ณ๊ฐ ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ์๋ฅผ ๋ค์ด ๋๋ฌด ํ๋ฉด์ ๊ฑฐ์นํ๋ฉด์ ๊ฐ์์ด๊ณ ๊ธ์ํ๋ฉด์ ๊ดํ์ด ๋๋ ๊ฒฝํฅ์ด ์์ต๋๋ค. ํ์ง๋ง, ์๋ก ๋ค๋ฅธ ์ฌ์ง์ ์ํ๋ ํ๋ฉด์ด ์ ์ฌํ reflectance๋ฅผ ๋ํ๋ผ ์๋ ์์ต๋๋ค. (e.g. ํ๋ผ์คํฑ, ์ ๋ฆฌ, ์์ค ๋ฑ์ ๋ชจ๋ ๋ฐํฌ๋ช ํ ์ ์์) ๋ฐ๋ผ์ reflectance๊ฐ ๋ฐ๋์ ์ฌ์ง ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๊ฒฐ์ ์ง๋ ์ ๋์ ์ธ ์์๋ ์๋๋๋ค.
- Texture
2D, 3D์ texture๋ ์ฌ์ง appearance์ ์ค์ํ ๊ตฌ์ฑ ์์์ ๋๋ค. ํ์ง๋ง ์๋ก ๋ค๋ฅธ ์ฌ์ง๋ก ๋ง๋ค์ด์ง ํ๋ฉด์ด ์๋นํ ์ ์ฌํ ์ง๊ฐ์ ๋ํ๋ผ ์๋ ์๊ธฐ ๋๋ฌธ์ ์ฌ์ง์ธ์์ ์ํด์ texture์๋ง ์์กดํ ์๋ ์์ต๋๋ค.
(a)๋ reflectance๋ ์ ์ฌํ์ง๋ง, ์๋ก ๋ค๋ฅธ ์ฌ์ง์ ์์์ด๊ณ , (b)๋ texture๋ ์ ์ฌํ์ง๋ง ์๋ก ๋ค๋ฅธ ์ฌ์ง์ ์์์ ๋๋ค.
- Object Information
์ฌ์ง ์ธ์ ๋ฌธ์ ๊ฐ ์ ์ฐ๊ตฌ๋ object recognition์ ์ผํ์ผ๋ก ์๊ฐํ ์๋ ์์ต๋๋ค. ์ปคํผ ๋จธ๊ทธ๋ ์ธ๋ผ๋ฏน, ์๋์ฐจ๋ ๊ธ์๊ณผ ์ ๋ฆฌ, ์์๋ ๋๋ฌด๋ก ๋ง๋ค์ด์ง๋ ๊ฒฝํฅ์ด ์๊ธฐ ๋๋ฌธ์ ๋๋ค. ์ด๋ ๋ฏ object์ material์๋ ๊น์ ์๊ด๊ด๊ณ๊ฐ ์์ง๋ง, ํนํ ์ธ๊ณต ๋ฌผ์ฒด์ ๊ฒฝ์ฐ ์ด๋ค์ ๊ด๊ณ๊ฐ ์ผ๋์ผ ๊ด๊ณ๊ฐ ์๋๋ฉฐ, ๋์ผํ object ์นดํ ๊ณ ๋ฆฌ ๋ฌผ์ฒด๊ฐ ๋ค๋ฅธ ์ฌ์ง๋ก ๋ง๋ค์ด ์ง ์๋ ์์ต๋๋ค.
(a) ๋ ๋์ผํ object ์นดํ ๊ณ ๋ฆฌ์ด์ง๋ง ๋ค๋ฅธ ์ฌ์ง๋ก ๋ง๋ค์ด์ง ์์์ ๋๋ค.
(b) ๋ ์๋ก ๋ค๋ฅธ object ์นดํ ๊ณ ๋ฆฌ์ด์ง๋ง ๋์ผํ ์ฌ์ง๋ก ๊ตฌ์ฑ๋ ์์์ ๋๋ค.
- Local feature
๋ณธ ๋ ผ๋ฌธ์์๋ ์ด๋ฏธ์ง์ ํฌ๊ธฐ๊ฐ ์๋๋ผ surface์ ํฌ๊ธฐ์ ์๋์ ์ธ 'local features' ์ 'non-local features'๋ผ๋ ์ฉ์ด๋ฅผ ์ฌ์ฉํฉ๋๋ค. color, texture, local shape์ local feature์ outline shape, object identity๋ non-local feature์ ํด๋นํฉ๋๋ค.
๋ณธ ๋ ผ๋ฌธ์์๋ local surface ํน์ฑ์ด ์ฌ์ง ์ธ์์ sufficientํ์ง๋ ์๋ค๊ณ ํฉ๋๋ค. ์๋ ๊ทธ๋ฆผ์์ ์์ค(a) ๋ shinyํ ํ๋ผ์คํฑ์ด๋ ๊ธ์์ผ๋ก, ๋ฐ์ค(a) ๋ ์ฌ๋์ ํผ๋ถ๋ ๋๋ฌด๋ก ๋ง๋ค์ด์ง ์๋ ์์ต๋๋ค. (b)์์ ์๋์ฐจ์ ๊ทธ๋ฆด๊ณผ ํ๋(์์ค), ํ ์ด๋ธ ๊ฐ์ฅ์๋ฆฌ์ ๊ธด ํ์ด๋ผ์ดํธ(๋ฐ์ค)๊ณผ ๊ฐ์ non-local surface ํน์ง์ ๊ณ ๋ คํด์ผ๋ง ์ฌ์ง์ ๋ถ๋ฅํ ์ ์์ต๋๋ค. Object๊ฐ ์ด๋ฏธ์ง์์ ์์ ํ ๋ณด์ผ ๋๋ ์ฌ์ง ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๋์ฑ ์ ํํฉ๋๋ค.(ํ ์ด๋ธ์... ๋ณดํต ๋๋ฌด๋ก ๋ง๋๋๊น) Surface appearance์ ์ด๋ฌํ non-local ํ ๋ถ๋ถ์ ์๋ณํ๊ณ ๋ชจ๋ธ๋งํ๋ ๊ฒ์ด ์ฑ๊ณต์ ์ธ ์ฌ์ง ๋ถ๋ฅ์ ํต์ฌ์ด๋ผ๊ณ ์๊ฐํ๋ค๊ณ ํฉ๋๋ค.
๊ทธ๋ฐ๋ฐ, ์ฌ์ค ์ ์ค๋ช ์ ๊ทนํ ์ผ๋ถ์ ๊ฒฝ์ฐ์๋ง ํด๋นํ๊ณ ํ์์ ์ ์ฌ์ง๋ถ๋ฅ๋ local ์ ๋ณด์ non-local ์ ๋ณด(global, contextual ์ ๋ณด๋ผ๊ณ ๋ ํจ)์ ์ ์ ํ ๋ฐธ๋ฐ์ค๋ฅผ ์ ์งํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ์ฌ์ง ๋ถ๋ฅ์ ๊ถ๊ทน์ ์ธ ๋ชฉํ๋ shape์ invariantํ๊ฒ ์ฌ์ง์ ๋ถ๋ฅํ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ด๊ณ , ๊ทธ๋ ๋ค๊ณ ํ์ง๋ง global ์ ๋ณด๊ฐ ์ค์ํ์ง ์๋ค๊ณ ๋ณผ ์๋ ์๊ธฐ ๋๋ฌธ์ ๋๋ค.
์์์ ์ค๋ช ํ ๋ค์ํ ์ด์ ๋ค๋ก object๋ scene๊ณผ ๋ฌ๋ฆฌ ์ฌ์ง ์นดํ ๊ณ ๋ฆฌ๋ฅผ ์๋ก ํ์คํ๊ฒ ๊ตฌ๋ถํ ์ ์๋ ์ด๋ฏธ์ง ํน์ง์ ์ฐพ๊ธฐ๋ ์ฝ์ง ์์ต๋๋ค. ์ฌ์ง surface๋ ํฌ๊ธฐ, 3D shape, color, reflectance, texture ๋ฑ ๋ค์ํ ํน์ง์ด ์กด์ฌํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
๋ณธ ๋ ผ๋ฌธ์์๋ (1) ์ฌ์ง์ ํน์ฑํํ๋๋ฐ ์ฌ์ฉํ ์ ์๋ low, mid-level image information์ ์ดํดํ๊ธฐ ์ํด perceptual ์ฐ๊ตฌ๋ฅผ ์ํํ๊ณ , (2) ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ํตํด image feature set์ ์ ์ํฉ๋๋ค.
Studying Human Material Perception Using Mechanical Turk
์ด๋ค ์ด๋ฏธ์ง์ ํน์ง์ด ์ฌ์ง์ ๋ถ๋ฅํ๋๋ฐ ์ ์ฉํ์ง ์ดํดํ๊ธฐ ์ํด ๋ณธ ๋ ผ๋ฌธ์์๋ ์ธ๊ฐ์ ์ธ์์ ์ด์ ์ ๋ง์ถฅ๋๋ค. ๋ค์ํ ์ด๋ฏธ์ง ํน์ง(์๊ฐ์ )์ ์ธ๊ฐ ๊ด์ฐฐ์์๊ฒ ์ ์ํ๊ณ ์ฌ์ง ์ธ์์์ ์ ํ๋๋ฅผ ์ธก์ ํ์ฌ ์ธ๊ฐ์ ๋ฐ์๊ณผ ์๊ด๊ด๊ณ๊ฐ ์๋ ์ด๋ฏธ์ง ํน์ง ์ ํ์ ์๋ณํ๋ ค ํฉ๋๋ค. Object ์์ฑ์ ์ด์ ์ ๋ง์ถ ํน์ง๊ณผ local ์ด๋ฏธ์ง ํน์ง, ์ด๋ฌํ ๋ ๊ฐ์ง ์ ํ์ ์ด๋ฏธ์ง ํน์ง์ ๊ฐ์กฐํ๋ ๋ฐฉ์์ผ๋ก FMD ์ด๋ฏธ์ง๋ฅผ ์๊ณกํ๊ณ ์ฌ๋๋ค์๊ฒ ๋ถ๋ฅํ๋๋ก ์์ฒญํฉ๋๋ค.
- Object feature
Object ๊ธฐ๋ฐ ์ด๋ฏธ์ง feature๋ฅผ ํ๊ฐํ๊ธฐ ์ํด ์ ์ฒด object shape์ ๊ฐ์กฐํ๊ณ color ๋ฐ reflectance ์ ๋ณด๋ฅผ ์ต์ํํ๋ ์ด๋ฏธ์ง๋ฅผ ๋ง๋ญ๋๋ค. ์ด๋ฌํ ์ด๋ฏธ์ง๋ฅผ ์ป๊ธฐ ์ํด ๋ ๊ฐ์ง ์ ํ(Bilateral filter, High-pass filter)์ ์ด๋ฏธ์ง ์ฒ๋ฆฌ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์๋ ๊ทธ๋ฆผ์ (b), (c)๊ฐ ์์์ด๋ฉฐ ํ๋ผ์คํฑ ์ฅ๋๊ฐ์ ํ์ด๋ผ์ดํธ๊ฐ ๊ฑฐ์ ์ฌ๋ผ์ง๊ณ ์์ธ์์ ํ๋ฉด๊ตฌ์กฐ๊ฐ ๋ ์๋ณด์ด๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
- Local feature
Local ์ด๋ฏธ์ง ํน์ง์ ํ๊ฐํ๊ธฐ ์ํด local ํ๋ฉด ์ ๋ณด๋ฅผ ๊ฐ์กฐํ๊ณ global ํ๋ฉด ์ ๋ณด๋ฅผ ์ต์ํํ๋ ์ด๋ฏธ์ง๋ฅผ ๋ง๋ค์์ต๋๋ค. FMD ์ด๋ฏธ์ง๋ฅผ locally preseve ๋์ง๋ง globally scramble ๋ ์ด๋ฏธ์ง๋ก ์ฌ์์ฑํ๊ธฐ ์ํด non-parametric texture synthesis algorithm์ ์ฌ์ฉํฉ๋๋ค. 15x15 ๋ฐ 30x30์ ๋ค๋ฅธ window size๋ฅผ ์ฌ์ฉํ์ผ๋ฉฐ, local scale์์ ์ด๋ฌํ ์ด๋ฏธ์ง๊ฐ ์๋ณธ๊ณผ ์ ์ฌํ๋๋ผ๋ ์ด๋ฌํ texture ํฉ์ฑ ์ด๋ฏธ์ง์์ object๋ฅผ ์๋ณํ๋ ๊ฒ์ ์ด๋ ต์ต๋๋ค.
์ธ๊ฐ์ ์ธ์ ๊ฒฐ๊ณผ๋ ์๋์ ๊ฐ์ต๋๋ค.
(a) : 84.9%
(b) : 65.3%
(c) : 64.8%
(d) : 38.7%
(e) : 46.9%
object๊ฐ ๊ฐ์กฐ๋ ์ด๋ฏธ์ง์์ ๊ฒฐ๊ณผ๊ฐ ๋ ๋์ ๊ฒ์ผ๋ก ๋ณด์ object์ ์ฌ์ง ๊ฐ์ ๊น์ ์๊ด๊ด๊ณ๊ฐ ์์์ ์ ์ ์์ต๋๋ค. local ์ ๋ณด๋ฅผ ๊ฐ์กฐํ ํฉ์ฑ์ด๋ฏธ์ง๋ ์ธ์ ๊ฒฐ๊ณผ๊ฐ ๋ง์ด ๋จ์ด์ง์ง๋ง randomํ ๊ฒฐ๊ณผ๋ณด๋ค๋ ๋๊ธฐ ๋๋ฌธ์ local ์ ๋ณด๋ ์ฌ์ง ๋ถ๋ฅ์ ๋์์ ์ค๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค. ๋ํ ์ธ๊ณต ์ฌ์ง(e.g. ํ๋ผ์คํฑ)๋ ์ฒ์ฐ ์ฌ์ง(e.g. ๋) ๋ณด๋ค texture ๋ชจ์์ด ๋์ฑ ๋ค์ํ๊ธฐ ๋๋ฌธ์ global ์ ๋ณด๊ฐ ์ ๊ฑฐ๋๋ฉด ์ธ์ํ๊ธฐ ์ด๋ ต์ต๋๋ค.
A Proposed Set of Image Features for Material Category Recognition
4๊ฐ์ ์ด๋ฏธ์ง feature group์ ์ฌ์ฉํฉ๋๋ค. ๊ฐ ๊ทธ๋ฃน์ surface appearance์ ๋ค๋ฅธ ๋ถ๋ถ์ ์ธก์ ํ๋๋ก ์ค๊ณ๋์์ต๋๋ค.(color and texture, micro-texture, outline shape, reflectance) ์ด ๊ทธ๋ฃน์ ๊ฐ๊ฐ 1~3๊ฐ์ feature๋ก ๊ตฌ์ฑ๋๋ฉฐ ๋ค์ํ ํฌ๊ธฐ์ ์ด๋ฏธ์ง ์์ญ์ ์ฌ์ฉํฉ๋๋ค.
1. Color and Texture
Jets(filter bank), SIFT
2. Micro-Texture
๋์ผํ BRDF๋ฅผ ๊ฐ์ง ๋ surface๋ surface micro-structure๊ฐ ์ ์ฌํ์ง ์์ ๊ฒฝ์ฐ ๋งค์ฐ ๋ค๋ฅด๊ฒ ๋ณด์ผ ์ ์์ต๋๋ค. Surface micro-structure ์ ๋ณด๋ฅผ ์ถ์ถํ๊ธฐ ์ํด bilateral filter๋ฅผ ํตํด ์ด๋ฏธ์ง๋ฅผ smoothingํ ํ, ์ถ๊ฐ ๋ถ์์ ์ํด residual image๋ฅผ ์ฌ์ฉํฉ๋๋ค. Bilateral filtering์ residual์ ๋ ๋ฏธ์ธํ ์ค์ผ์ผ์์์ pixel intensity์ ๋ณํ๋ฅผ ๋ํ๋ ๋๋ค. ์๋ ๊ทธ๋ฆผ์ fabric, metal์๋ surface micro-structure ์ ๋ณด๊ฐ ํฌํจ๋์ด ์๋ ๋ฐ๋ฉด ์ ๋ฆฌ์ ๊ฒฝ์ฐ ์ด๋ฌํ ๋ณํ๋ translucency(๋ฐํฌ๋ช ๋)์ ๊ด๋ จ์ด ์์ต๋๋ค. Surface micro-structure์ ๊ธฐ์ฌ๋ฅผ reflectance์ ๋ช ํํ๊ธฐ ๊ตฌ๋ณํ๊ธฐ๋ ํ๋ค์ง๋ง, residual์ ์ฌ๋ฃ์ธ์์ ์ํ ์ ์ฉํ ์ ๋ณด๊ฐ ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
์ด๋ฌํ residual ์ด๋ฏธ์ง์ ์ ๋ณด๋ฅผ ํน์ฑํํ๊ธฐ ์ํด residual ์ด๋ฏธ์ง์์ jets, SIFT feature๋ฅผ ๊ณ์ฐํฉ๋๋ค.
micro-jets, micro-SIFT
3. Outline Shape
Edge map์ ์ป๊ธฐ ์ํด canny edge detector๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ฌ์ง ์นดํ ๊ณ ๋ฆฌ์ ๋ฐ๋ฅธ edge map์ ๋ณํ๋ฅผ ํน์ฑํํ๊ธฐ ์ํด edge map์์ edge์ curvature(๊ณก๋ฅ )์ ํน์ง์ผ๋ก ์ธก์ ํ์ต๋๋ค.
4. Reflectance-based feature
Reflectance ํน์ฑ์ ๋๋๋ก surface ๊ฐ์ฅ์๋ฆฌ์์ ๋๋ ทํ intensity ๋ณํ๋ก ๋ํ๋ฉ๋๋ค. ์ด๋ฌํ ๋ณํ๋ฅผ ์ธก์ ํ๊ธฐ ์ํด ์ด๋ฏธ์ง์ ๊ฐ์ฅ์๋ฆฌ ๊ทผ์ฒ ์์ญ์ HOG feature๋ฅผ ์ฌ์ฉํฉ๋๋ค.
Edge-slice, Edge-ribbon
Classifiers for Material Category Recognition
LDA, SVM ์ฌ์ฉ