๋ณธ ๋ ผ๋ฌธ์ CVPR2018์ ๊ฒ์ฌ๋ few shot learning ์ด๋ผ๋ ์ฃผ์ ์ ๋ ผ๋ฌธ์ ๋๋ค.
๋ฅ๋ฌ๋์์ ๋ฐ์ดํฐ์ ๊ฐ์๋ ์ฑ๋ฅ๊ณผ ์ง๊ฒฐ๋์ง๋ง, ํ์ค์ ์ธ ํ ์คํฌ์์ ๋ฐ์ดํฐ ๊ฐ์๋ ๋ ๋ถ์กฑํ ์ ๋ฐ์ ์์ต๋๋ค.
์ด๋ฌํ limited data ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด data ์ฐจ์์์๋ data augmentation ๋ฐฉ๋ฒ์ด ์กด์ฌํ๊ณ , network ์ฐจ์์์๋ Un/Semi-supervised learning, Transfer learning, Meta learning ๋ฐฉ๋ฒ ๋ฑ์ด ์กด์ฌํฉ๋๋ค. few shot learning์ meta learning ๋ฐฉ์์ ์ฌ์ฉํ์ฌ ์ ์ data ๊ฐ์๋ก network๋ฅผ ํ์ต์ํค๋ ๋ฐฉ๋ฒ๋ก ์ ๋๋ค. Meta learning์๋ metric, model, optimization, GCN ๋ฑ ๋ค์ํ base์ ์ฐ๊ตฌ๊ฐ ์กด์ฌํฉ๋๋ค.
Few shot learning์ ๋งค์ฐ ์ ์ ๋ฐ์ดํฐ ๊ฐ์๋ก ๋คํธ์ํฌ๋ฅผ ํ์ต์ํค๋ ๋ฐฉ๋ฒ์ด๋ฉฐ 'N-way K-shot' ๋ฌธ์ ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. N์ class์ ๊ฐ์์ด๋ฉฐ, K๋ class๋ณ ๋ฐ์ดํฐ์ ์๋ฅผ ์๋ฏธํฉ๋๋ค. K๊ฐ ๋ง์์๋ก class๋ณ ์ธ์คํด์ค์ ์๊ฐ ๋ง์์ง๋ฏ๋ก ์ฑ๋ฅ์ด ์ข์์ง๊ณ N์ด ๋ง์์ง๋ฉด ๋ถ๋ฅํด์ผํ class์ ์๊ฐ ๋์ด๋๊ธฐ ๋๋ฌธ์ ์ฑ๋ฅ์ด ๋จ์ด์ง๋๋ค. Few shot learning์ K๊ฐ ๋งค์ฐ ์์ ์ํฉ์ ๊ฐ์ ํ๋ฉฐ ๋๋ถ๋ถ ์ฐ๊ตฌ์์๋ benchmark๋ก 5-way 1-shot, 5-way 5-shot ๋ฅผ ์ฌ์ฉํฉ๋๋ค.
Few shot learning ๋ชจ๋ธ์ด ์๋ก์ด ๋ฐ์ดํฐ(ํ์ตํ์ง ์์ class)์์๋ ์ ๋์ํ๋๋ก episodic training ๋ฐฉ์์ meta-learning์ ์ฌ์ฉํ์ฌ ์ผ๋ฐํ ์ฑ๋ฅ์ ๊ทน๋ํ์ํต๋๋ค.
*Meta-learning : ์ ์ ์์ data๋ก ๋ชจ๋ธ์ ํ์ต์ํค์ํ learn to learn ๋ฐฉ์์ ํ์ต ๋ฐฉ๋ฒ์ ์ง์นญ
Episode Learning
Episodic training์ ๋์ฉ๋ training dataset์์ N-way K-shot์ support set 1๊ฐ์ query set 1๊ฐ๋ก 1๊ฐ์ ์ํผ์๋๋ฅผ ๋ง๋ญ๋๋ค. ์ฌ๋ฌ๊ฐ์ ์ํผ์๋๋ฅผ ์์ฑํ์ฌ ๋คํธ์ํฌ๋ฅผ ํ์ต์ํค๊ณ test์์๋ training dataset์ ์กด์ฌํ์ง ์์๋ class๋ก support set๊ณผ query set์ ๋ง๋ค์ด ํ ์คํธํฉ๋๋ค.
1) Training data์์ n-way k-shot ์ data ์ถ์ถํ์ฌ support set ๊ตฌ์ฑ
2) Training data์์ support set์ ํฌํจ๋ class๋ก query set ๊ตฌ์ฑ
3) Query set์ ํ๊ฐํ๊ณ ๊ณ์ฐ๋ loss๋ก Network์ update
4) 1~3๋ฒ์ ๋ฐ๋ณตํ๋ฉฐ training set์๋ ์๋ class๋ฅผ ๊ฐ์ง๋ test dataset์ผ๋ก support/query set์ ๋ง๋ค์ด ์ฑ๋ฅ์ ํ ์คํธํฉ๋๋ค.
Metric Learning Approach
Metric-based ๋ฐฉ๋ฒ์ ์ด๋ฏธ์ง๊ฐ feature space๋ก embedding๋์์ ๋ ๋์ผํ class๋ผ๋ฆฌ๋ feature๊ฐ ๋งค์ฐ ๊ฐ๊น์ด ๊ฑฐ๋ฆฌ์ ์๋๋ก ํ์ต์ํค๊ณ ์๋ก ๋ค๋ฅธ class๋ผ๋ฆฌ๋ ๋จผ ์์น์ ์๋๋ก ํ์ต์ํค๋ ๋ฐฉ๋ฒ์ ๋๋ค. feature space์์ feature ๊ฐ ๊ฑฐ๋ฆฌ๋ euclidean metric, cosine metric ๋ฑ์ ๋ฐฉ๋ฒ์ผ๋ก ๋ฏธ๋ถ๊ฐ๋ฅํ distance๋ฅผ ์ฌ์ฉํฉ๋๋ค. Ground truth๋ 2๊ฐ ์ธ์คํด์ค๊ฐ ์๋ก ๋์ผํ class์ธ ๊ฒฝ์ฐ 1๋ก, ์๋ก ๋ค๋ฅธ class์ธ ๊ฒฝ์ฐ 0์ผ๋ก ์ง์ ํ์ฌ similarity๊ฐ ๋์ data ์์ผ์๋ก output์ด 0์์ 1์ ๊ฐ๊น์์ง๋๋ก ํ์ต์ํต๋๋ค.
๊ฐ์ฅ ๊ฐ๋จํ ๋ฐฉ๋ฒ์ผ๋ก๋ ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํ๋์ network์ 2๊ฐ์ ์ด๋ฏธ์ง๋ฅผ ๋ฃ๊ณ ์๋ฒ ๋ฉ๋ feature 2๊ฐ๋ก feature distance๋ฅผ ์ฌ๋ ์ด ๋คํธ์ํฌ๊ฐ ์์ต๋๋ค.
์ฆ, ์ด๋ฌํ ๋ฐฉ์์ผ๋ก ํ์ต์ํค๋ฉด ์ผ๋ฐ์ ์ธ classification ๋ฌธ์ ์๋ ๋ฌ๋ฆฌ ์ด๋ฏธ class ์ ๋ณด๋ฅผ ์๊ณ ์๋ ์ด๋ฏธ์ง 1์ฅ๊ณผ ํ ์คํธ ์ด๋ฏธ์ง 1์ฅ์ ๋ฃ์ด 2๊ฐ์ ์ด๋ฏธ์ง๊ฐ ๋์ผํ ํด๋์ค์ธ์ง ๋์ผํ์ง ์์ ํด๋์ค์ธ์ง๋ฅผ ๋ถ๋ฅํ๊ฒ ๋ฉ๋๋ค.
ํ์ง๋ง, ์ญ์ ํ ์คํธํ ๋ฐ์ดํฐ์ class๋ก ํ์ตํ์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ ํ์ต ๋ฐ์ดํฐ์ ํ ์คํธ ๋ฐ์ดํฐ์ domain difference๊ฐ ํฐ ๊ฒฝ์ฐ์๋ ์ฑ๋ฅ์ด ๋ง์ด ์ ํ๋ฉ๋๋ค.
Relation Network
previous work์์๋ euclidean distance, cosine distance๋ฅผ ์ด์ฉํ์ฌ ํ์ต์์ผฐ๋๋ฐ, ๋ณธ ๋ ผ๋ฌธ์์๋ Relation Module(RM) ์ด๋ผ๋ fc layer๋ฅผ ํตํด 2์ฅ์ ์ด๋ฏธ์ง๋ก ๋ถํฐ ์ถ์ถ๋ 2๊ฐ์ feature๋ฅผ concat ์ํค๊ณ RM์ ๊ฑฐ์ณ relation score๋ฅผ ์์ฑํ๊ฒ ๋๊ณ ์ด๋ ์ด๋ฏธ์ง 2์ฅ์ similarity๋ฅผ ๋ํ๋ด๊ฒ ๋ฉ๋๋ค.
์ฆ, ์ด์ ์ฐ๊ตฌ์์๋ ์ ํด์ง ์ฐ์ฐ(euclidean metric, cosine metric)์ผ๋ก 2๊ฐ feature ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ตฌํ๋ค๋ฉด ๋ณธ ๋ ผ๋ฌธ์์๋ feature 2๊ฐ๋ฅผ ์ฐ๊ฒฐํ๊ณ fc layer ๋ก similarity ๋ฅผ ํ์ตํ์ฌ relation score๋ฅผ ๊ณ์ฐํฉ๋๋ค. ํ์ต๊ฐ๋ฅํ ๋ฐฉ์์ผ๋ก similarity๋ฅผ ๊ตฌํ๊ธฐ ๋๋ฌธ์ ์ด์ ์ฐ๊ตฌ์ ๋นํด ์ฑ๋ฅ์ด ์ข๊ฒ ๋์ค๋ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค.