Class Imabalance ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ CVPR 2019์ ๊ณต๊ฐ๋ ๋ ผ๋ฌธ์ ์๊ฐํฉ๋๋ค. ์ด๋ฒ ๋ฆฌ๋ทฐ๋ ๋ฌธ์ ์ ์์ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์ ๊ฐ๋ ์ ์ผ๋ก ์ค๋ช ํฉ๋๋ค. (๋ํ ์ผ ์ ์ธ)
Class Imbalance ?
Class Imbalance ๋ฌธ์ ๋ผ๋ ๊ฒ์ ๋ฅ๋ฌ๋์์ ๋คํธ์ํฌ๋ฅผ ํ์ต์ํฌ ๋ ์ฌ์ฉ๋๋ training data ์ class ๊ฐ์๊ฐ balance ๊ฐ ๋ง์ง ์๋ ์ํฉ์ ๋งํฉ๋๋ค. ์ค์ ๋ฐ์ดํฐ์์๋ ๋งค์ฐ ๋น๋ฒํ ์ผ์ด๊ธฐ์ ์ค์ํ task ๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค. ํ๊ณ์์๋ Long tail data ๋ผ๋ ๋ฐ์ดํฐ ๊ฐ์๊ฐ ๋ง์ class ๋ถํฐ ์์ฃผ ์ ์ class ๊น์ง ๋ค์ํ๊ฒ ๋ถํฌํ๋ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ class imabalance ๋ฌธ์ ์์ ์ฑ๋ฅ์ ๋น๊ตํฉ๋๋ค.
์ผ๋ฐ์ ์ธ ํด๊ฒฐ ๋ฐฉ๋ฒ ?
Class Imbalance๋ ๋ฐ์ดํฐ๊ฐ ์ ์ class ๋ ๋ฐ์ดํฐ๊ฐ ๊ทธ class๋ฅผ ์ถฉ๋ถํ ํํํ์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ ํ์ต ์ decision boundary๊ฐ ๋ฐ์ดํฐ๊ฐ ์ ์ class ์ชฝ์ผ๋ก ๋ฐ๋ฆฌ๋ ๊ฒฝํฅ์ด ์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ ํต์ ์ผ๋ก Re-sampling, Re-weighting ๋ฑ์ ๋ฐฉ๋ฒ์ด ์กด์ฌํฉ๋๋ค. Re-sampling์ ๋ฐ์ดํฐ์ ์ ๋ฐธ๋ฐ์ค๋ฅผ ๋ง์ถ๊ธฐ ์ํด ๋ฐ์ดํฐ๊ฐ ์ ์ class์ ๋ฐ์ดํฐ๋ฅผ augmentation ๋ฑ์ ํตํด ๋๋ฆฌ๊ฑฐ๋, ๋ฐ์ดํฐ๊ฐ ๋ง์ class์ ๋ฐ์ดํฐ๋ฅผ ์ค์ด๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์ด๋ฌํ ๋ฐฉ๋ฒ์ ์ผ๋ฐ์ ์ธ ์ํฉ์์ ํฌ๊ฒ ์ข์ ํจ๊ณผ๋ฅผ ๊ฑฐ๋์ง ๋ชปํ๊ณ , Re-weighting์ class์ ๋ฐ๋ผ weight update ๋ฅผ ํ๋ ์ ๋์ ์ฐจ์ด๋ฅผ ๋ฌ์ ๋ฐธ๋ฐ์ค ์๊ฒ ํ์ต์ํค๋ ๋ฐฉ๋ฒ์ ๋๋ค. Previous work ์์๋ class frequency ์ฆ, data๊ฐ ๋ง์ class ๋ weight๋ฅผ ์๊ฒ ์ ๋ฐ์ดํธํ๊ณ data๊ฐ ๋ง์ classs๋ weight๋ฅผ ํฌ๊ฒ ์ ๋ฐ์ดํธ ํ๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค. Loss function์์ class frequency์ inverse๋ฅผ ๊ณฑํ์ฌ ๋ชจ๋ธ์ ์ ๋ฐ์ดํธ ํ๋ ๋ฐฉ์์ ๋๋ค. ํ์ง๋ง, ์ด๋ ๋ฐ์ดํฐ๊ฐ ๋ง์ class ์ชฝ์ผ๋ก decision boundary ๊ฐ ๋๋ฌด ๋ง์ด ๋ฐ๋ ค ์ฑ๋ฅ์ด ํฌ๊ฒ ์ข์ง ๋ชปํฉ๋๋ค.
Proposed Methods
๋ณธ ๋ ผ๋ฌธ์์๋ ์ด๋ฅผ ๊ฐ์ ํ๊ณ ์ Effective number ๋ผ๋ ๋ฐฉ์์ ๋์ ํฉ๋๋ค.
์ผ๋ฐ์ ์ผ๋ก ๋ฐ์ดํฐ์ ๊ฐ์๊ฐ ๋ง์์ง๋ฉด, ์ ๋ณด์ ์๋ ๋ง์์ง๋๋ค. ํ์ง๋ง, ๋ฐ์ดํฐ๊ฐ ๊ณ~์ ์์ด๊ฒ๋๋ฉด ์ค๋ณต๋๋(overlap) ์ ๋ณด๊ฐ ๋ฐ์ํ๊ณ ์ด๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ํ์ต ์ ํฐ ์ด์ ์ ์ฃผ์ง ๋ชปํฉ๋๋ค. ๊ฐ๋จํ ์ค๋ช ํ๋ฉด ๊ฐ์์ง๋ผ๋ class๊ฐ ์ด๋ฏธ์ง๊ฐ 1000์ฅ ์ฏค ๋๋ ์ด๋ฏธ ๊ฑฐ์ ๋ชจ๋ ๊ฐ์์ง๋ฅผ ํฌํจํ๊ฒ ๋๋ค๋ฉด 1000์ฅ์ ๋์ด์ 3000์ฅ 5000์ฅ์ ์ฌ์ฉํ๋๋ผ๋ ์ ๋ณด๋์ด ํฌ๊ฒ ๋ ๋ง์์ง์ง๋ ์๋๋ค๋ ๊ฒ์ ๋๋ค. ์ด์ ์ฐ๊ตฌ์์๋ ์ด๋ฌํ ์ฌ์ค์ ๊ฐ๊ณผํ์ฑ class์ ๋ฐ์ดํฐ ๊ฐ์๋ง์ผ๋ก ํ์ต ์ ๋๋ฅผ ์กฐ์ ํ์ต๋๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ data์ overlap์ ์์น์ ์ผ๋ก ์ธก์ ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๊ณ , ์ด๋ฅผ Effective number ๋ผ๊ณ ํฉ๋๋ค. ์ด์ ์ฐ๊ตฌ์์ class frequency ์ inverse๋ฅผ loss function์ ๊ณฑํ๋ค๋ฉด, ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ ๋ฐฉ๋ฒ์ effective number์ ์ญ์๋ฅผ loss function์ ๊ณฑํ์ฌ ์ฌ์ฉํฉ๋๋ค. ์ฆ, ์๋ฏธ์๋(effective) ๋ฐ์ดํฐ๊ฐ ๋ง์์๋ก ์ ๊ฒ ์ ๋ฐ์ดํธ ํ๋ ๋ฐฉ์์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋ฉ๋๋ค.
๊ทธ๋ฐ๋ฐ... ๊ตฌ๊ตฌ์ ์ ๋ณธ ๋ ผ๋ฌธ์์ data overlap์ ๋ํด ์ค๋ช ํ๊ณ ์์์ ์ผ๋ก ์ฆ๋ช ์ ํ์ง๋ง, ์ค์ ๋ก class ๋ณ data์ overlap์ ์ธก์ ํ์ง๋ ์์ต๋๋ค (?). ํ์ดํผํ๋ผ๋ฏธํฐ์ธ ๋ฒ ํ ๊ฐ์ ์ฌ์ฉํ์ฌ class์ data๊ฐ ์ผ์ ์์ค์ ๋์ด์๋ฉด ๋ ์ด์ effectiveํ data๊ฐ ๋์ง์๋ ์ฆ, saturation๋๋๋ก ์ค์ ํ๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค. ์ Figure 3๋ฅผ ๋ณด๋ฉด ๋ฒ ํ ๊ฐ์ ๋ฐ๋ฅธ class-balanced term ๊ทธ๋ํ๋ฅผ ๋ณผ ์ ์์ต๋๋ค. ๋ฒ ํ=0 ์ผ ๋๋ class balanced term ์ด ์ ์ฉ์ด ์๋๋ ๊ฒฝ์ฐ์ด๊ณ , ๋ฒ ํ=1์ธ ๊ฒฝ์ฐ์๋ previous work์ฒ๋ผ class frequency๋ก ๋๋ ์ค ์ํ์ ๋๋ค. ๊ทธ ์ฌ์ด์ ๋ฒ ํ ๊ฐ์ class์ ์ํ ์๊ฐ ๋ง์์ง๋ค๊ฐ ์ด๋ ์๊ฐ saturation ๋๋ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค.
์ด ๋ถ๋ถ์ด ์กฐ๊ธ ์์ํ๋๊ฒ, ์ฌ์ค class ์ ์ ํ์ ๋ฐ๋ผ overlap ๋๋ ์๊ฐ ๋ค๋ฅผ ๊ฒ์ ๋๋ค. ์๋ํ๋ฉด ๊ต์ฅํ ๋จ์ํ class๋ ์ํ ์๊ฐ ์กฐ๊ธ๋ง ์์ด๋ class๋ฅผ ๋ชจ๋ ์ปค๋ฒํด์ ๊ธ๋ฐฉ overlap์ด ์๊ธธ ๊ฒ์ด๊ณ , deformation์ด ๋ง์ ๋ณต์กํ class์ ๊ฒฝ์ฐ์๋ ๊ฝค ๋ง์ ์ํ์ด ์์ด๋ overlap์ด ์๋ ์๋ ์๊ธฐ ๋๋ฌธ์ ๋๋ค. ํ์ง๋ง ๋ณธ ๋ ผ๋ฌธ์์๋ class ์ ํ๋ณ overlap์ ๋ํ ์ฐจ์ด๋ฅผ ๋์ง๋ ์๊ณ ํ์ดํผํ๋ผ๋ฏธํฐ์ธ ๋ฒ ํ ๊ฐ์ ๊ฐ์ ์กฐ์ ํ๋ฉฐ ํน์ ์ํ ๊ฐ์ ์ด์์์๋ data overlap์ด ๋ฐ์ํ๋ ๊ฒ์ผ๋ก ๋๊ณ ์คํ์ ์งํํ๊ณ ์์ต๋๋ค. ํ์ง๋ง, ๊ต์ฅํ ๊ฐ๋จํ๊ณ ์ด์ ๋ฐฉ๋ฒ์ ๋นํด ์ฑ๋ฅ๋ ์ข์์ง๊ธด ํฉ๋๋ค.
์์ง ์ด ๋ถ์ผ์ ๋ํด ์์ธํ ์์ง ๋ชปํ๊ณ ๋น๊ต์ ์ค๋๋ ๋ ผ๋ฌธ์ด๋ผ ํ์ฌ๋ ๋ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ๋ค์ด ๋ง์ผ๋ฆฌ๋ผ ์๊ฐํฉ๋๋ค. ๊ธฐํ๊ฐ ๋๋ฉด ๊ฐ์ฅ ์ต๊ทผ์ ๋ ผ๋ฌธ์ ์ฝ์ด๋ณด๊ณ ๋ฆฌ๋ทฐํ๋๋ก ํ๊ฒ ์ต๋๋ค.