๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ“– Theory/AI & ML

[ML] Classification ์„ฑ๋Šฅ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•

by ๋ญ…์ฆค 2022. 3. 23.
๋ฐ˜์‘ํ˜•

Classification์˜ ์„ฑ๋Šฅ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์ธ TP, TN, FP, FN, Recall, Precision, ROC,... ๋“ฑ์„ ์ •๋ฆฌ

 

Binary classification ์„ฑ๋Šฅ ํ‰๊ฐ€

  • True Positive(TP) : P → P ๋กœ ์˜ˆ์ธก (์ •๋‹ต)
  • True Negative(TN) : N → N ์œผ๋กœ ์˜ˆ์ธก (์ •๋‹ต)
  • False Positive(FP) : N → P ๋กœ ์˜ˆ์ธก (์˜ค๋‹ต)
  • False Negative(FN) : P → N ์œผ๋กœ ์˜ˆ์ธก (์˜ค๋‹ต)

 

 

  • Accurarcy : ๋ชจ๋“  ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ์ค‘, ์ž˜ ๋ถ„๋ฅ˜ํ•œ ๋ฐ์ดํ„ฐ์˜ ๋น„์œจ
  • Recall : Positive ์ค‘์— Positive๋ผ๊ณ  ์˜ˆ์ธกํ•œ ๋น„์œจ. (P→P)์™€ (P→N) ์ค‘ (P→P)์˜ ๋น„์œจ
  • Precision : Positive ๋ผ๊ณ  ์˜ˆ์ธกํ•œ ๊ฒƒ ์ค‘ ์‹ค์ œ positive ์ธ ๋น„์œจ. (P→P)์™€ (N→P) ์ค‘ (P→P)์˜ ๋น„์œจ
  • Receiver Operating Characteristics (ROC) : TPR๊ณผ FPR์„ ๊ฐ๊ฐ ์„ธ๋กœ์ถ• ๊ฐ€๋กœ์ถ•์œผ๋กœ ํ•œ ๊ทธ๋ž˜ํ”„. TPR์€ positive ๋ฐ์ดํ„ฐ ์ค‘ positive๋กœ ์˜ˆ์ธกํ•œ ๋น„์œจ(recall๊ณผ ๋™์ผ)๋กœ ๋†’์„ ์ˆ˜๋ก ์ข‹๊ณ , FPR์€ negative ๋ฐ์ดํ„ฐ ์ค‘ positive๋กœ ์ž˜๋ชป ์˜ˆ์ธกํ•œ ๋น„์œจ๋กœ ๋‚ฎ์„์ˆ˜๋ก ์ข‹๋‹ค. ํ•˜์ง€๋งŒ, binary classification์˜ ๊ฒฝ์šฐ TPR ๊ณผ FPR์€ ํŠธ๋ ˆ์ด๋“œ ์˜คํ”„์˜ ๊ด€๊ณ„๋ฅผ ๊ฐ€์ง€๋ฏ€๋กœ ROC curve๋ฅผ visualizeํ•˜์—ฌ ๊ฐ ์ž„๊ณ„๊ฐ’์—์„œ์˜ ์„ฑ๋Šฅ์„ ํ™•์ธํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋‹ค.
  • Area Under Curve (AUC) : ROC curve์˜ ์šฐํ•˜๋‹จ ์ชฝ์˜ ๋ฉด์ ์œผ๋กœ, AUC๊ฐ€ 1์— ๊ฐ€๊นŒ์šธ ์ˆ˜๋ก ์ข‹์€ ์„ฑ๋Šฅ์ด๋‹ค.

 

ROC and AUC

 

Multi-class Classification ์„ฑ๋Šฅ ํ‰๊ฐ€

 

  • Mean Accuracy : ์ „์ฒด ํด๋ž˜์Šค ์ค‘ ์ •๋‹ต์„ ๋งž์ถ”๋Š” ๋น„์œจ ํ‰๊ท 
  • Standard Deviation : ํ‘œ์ค€ ํŽธ์ฐจ
  • Confusion Matrix : ํด๋ž˜์Šค by ํด๋ž˜์Šค ์˜ˆ์ธก ๋น„์œจ
  • t-distributed Stochastic Neighbor Embedding(t-SNE) : ๊ณ ์ฐจ์›์˜ ๋ฐ์ดํ„ฐ๋ฅผ 2์ฐจ์›์œผ๋กœ ์ฐจ์›์ถ•์†Œํ•˜์—ฌ ์‹œ๊ฐํ™”
  • ์ถ”๊ฐ€ : # of parameters, FLOPS, GPU Time, ํ•™์Šต ์†๋„,.. etc

 

  • multi-class ์˜ ๊ฒฝ์šฐ ์—ฌ๋Ÿฌ class์˜ ํ‰๊ท  ์ •ํ™•๋„๋ฅผ ๊ธฐ๋ณธ์œผ๋กœ training/test dataset ์˜ split์ด ์—ฌ๋Ÿฌ๊ฐœ๋กœ ๋‚˜๋‰˜์–ด ์žˆ๋Š” ๊ฒฝ์šฐ, ํ‘œ์ค€ํŽธ์ฐจ๋ฅผ ํ•จ๊ป˜ ๋ช…์‹œ (ํ‘œ์ค€ํŽธ์ฐจ๊ฐ€ ๋‚ฎ์„์ˆ˜๋ก ๋ฐ์ดํ„ฐ์…‹์— robustํ•œ ์•ˆ์ •์ ์ธ ๋ชจ๋ธ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Œ)

 

  • ๋˜ํ•œ, class by class ์„ฑ๋Šฅ์„ ๋ณด๊ธฐ ์œ„ํ•ด confusion matrix๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜, ์ด์ „ SOTA ๋ชจ๋ธ๋“ค๊ณผ ๊ณตํ‰ํ•˜๊ฒŒ ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•ด ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜, ๊ณ„์‚ฐ๋Ÿ‰ ๋“ฑ์„ ๋ช…์‹œ (์•„๋ฌด๋ฆฌ ์„ฑ๋Šฅ์ด ์ข‹์•„์ ธ๋„ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๋„ˆ๋ฌด ๋งŽ์•„์ง€๊ฑฐ๋‚˜ ๊ณ„์‚ฐ๋Ÿ‰์ด ๋„ˆ๋ฌด ๋งŽ์•„์ง„๋‹ค๋ฉด ๋น„ํšจ์œจ์ ์ธ ๋ชจ๋ธ์ด๊ธฐ ๋•Œ๋ฌธ)

 

  • t-SNE์˜ ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ๋ฅผ feature space๋กœ embedding ํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๊ฐ™์€ ํด๋ž˜์Šค๋ผ๋ฆฌ ์–ผ๋งˆ๋‚˜ ์ž˜ ๋ญ‰์น˜๊ณ , ๋‹ค๋ฅธ ํด๋ž˜์Šค์™€๋Š” ์ž˜ ๋ถ„๋ฆฌ๋˜๋Š”์ง€ ์‹œ๊ฐํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ.  ๋˜ํ•œ, ๋‹ค๋ฅธ ํด๋ž˜์Šค์ด์ง€๋งŒ ์œ ์‚ฌํ•œ ํด๋ž˜์Šค๋ผ๋ฆฌ๋Š” feature space์—์„œ ๊ฐ€๊น๊ฒŒ ์œ„์น˜ํ•˜๋Š” ๋“ฑ manifold ์ฐจ์›์—์„œ์˜ ๋ถ„์„์ด ๊ฐ€๋Šฅ.

 

mean acc, std, confusion matrices ์˜ˆ์‹œ
# of parameters, FLOPS, GPU Times ์˜ˆ์‹œ

๋ฐ˜์‘ํ˜•