๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐ŸŒŸ AI & ML Tech

[NAVER DEVIEW 2023] ์˜์นด ์นด์…ฐ์–ด๋ง ๋„๋ฉ”์ธ์—์„œ์˜ Continuous AI System

by ๋ญ…์ฆค 2023. 3. 1.
๋ฐ˜์‘ํ˜•

์ตœ๊ทผ NAVER DEVIEW 2023 ์ปจํผ๋Ÿฐ์Šค์— ๋‹ค๋…€์™”๋‹ค. ์ฐธ๊ฐ€ ์‹ ์ฒญ์ด ๊ฑฐ์˜ ์ˆ˜๊ฐ• ์‹ ์ฒญ ๊ธ‰์ด์—ˆ๋Š”๋ฐ ์šด ์ข‹๊ฒŒ ํ‹ฐ์ผ“์„ ์–ป๊ฒŒ ๋˜์—ˆ๋‹ค.

 

DAY1์—์„œ ์˜์นด์˜ Continual Learning ๊ด€๋ จ ์„ธ์…˜์— ํฅ๋ฏธ๊ฐ€ ์ƒ๊ฒจ์„œ ๋ฐœํ‘œ๋ฅผ ๋“ฃ๊ณ  ๋ฆฌ๋ทฐ๋ฅผ ํ•ด๋ณด๊ณ ์ž ํ•œ๋‹ค.

 

  • ํ–‰์‚ฌ : NAVER DEVIEW 2023 DAY 1
  • ์„ธ์…˜ : ์ดˆ๋“ฑํ•™์ƒ AI๋ชจ๋ธ ๊ณ ๋“ฑํ•™๊ต ๋ณด๋‚ด๊ธฐ: Continual Learning์œผ๋กœ ์ง€์†์ ์œผ๋กœ ์„ฑ์žฅํ•˜๋Š” AI ์‹œ์Šคํ…œ ๋งŒ๋“ค๊ธฐ
  • ์นดํ…Œ๊ณ ๋ฆฌ : AI/ML, DATA

 

AI ์‹œ์Šคํ…œ์˜ ๊ฒฝ์šฐ ์ƒˆ๋กœ์šด task๊ฐ€ ๋ฐœ์ƒํ•˜๋ฉด ๋ชจ๋ธ์„ ์—…๋ฐ์ดํŠธํ•˜๊ณ  ์žฌํ•™์Šต์‹œ์ผœ ๋‹ค์‹œ ๋ฐฐํฌํ•˜๋Š” ๊ณผ์ •์„ ๊ฑฐ์ณ์•ผํ•˜๋Š”๋ฐ, ์ด๋Š” ๊ต‰์žฅํžˆ ๋‚ญ๋น„์ ์ธ ์ผ์ด๋ผ continuous AI system์˜ ํ•„์š”์„ฑ์ด ๋Œ€๋‘๋˜๊ณ  ์žˆ๋‹ค. ์˜์นด์—์„œ๋„ ์นด์…ฐ์–ด๋ง ๋„๋ฉ”์ธ์—์„œ ๊ฐœ๋ฐœ์ž์˜ ๋ฆฌ์†Œ์Šค๋ฅผ ์ตœ์†Œํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์ง€์†์ ์œผ๋กœ ์„ฑ์žฅํ•˜๋Š” AI system์„ ๊ตฌ์ถ•ํ–ˆ๋‹ค๊ณ  ํ•œ๋‹ค.

 


# ์นด์…ฐ์–ด๋ง ๋„๋ฉ”์ธ

๋ฐœํ‘œ์—์„œ๋Š” ์˜์นด์˜ ์นด์…ฐ์–ด๋ง ๋„๋ฉ”์ธ์— ๋Œ€ํ•ด์„œ๋„ ์„ค๋ช…ํ•ด์ฃผ๋Š”๋ฐ ์ƒ๋‹นํžˆ ํฅ๋ฏธ๋กœ์› ๋‹ค. ์˜์นด๋ฅผ ์ด์šฉํ•ด๋ดค๋‹ค๋ฉด ์•Œ ์ˆ˜ ์žˆ๋Š”๋ฐ, ๊ณต์œ  ์ฐจ๋Ÿ‰์„ ์ด์šฉํ•˜๊ธฐ ์ „ํ›„๋กœ ์ฐจ๋Ÿ‰ ์ƒํƒœ๋ฅผ ์ดฌ์˜ํ•˜์—ฌ ์–ดํ”Œ์— ์—…๋กœ๋“œํ•˜๊ฒŒ ๋œ๋‹ค. ์ด ๋•Œ ์œ ์ž…๋˜๋Š” ์ฐจ๋Ÿ‰ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•ด์„œ ์ฐจ๋Ÿ‰์„ ๊ด€๋ฆฌ์— ํ™œ์šฉํ•œ๋‹ค๊ณ  ํ•œ๋‹ค. ์ฐจ๋Ÿ‰์ด ํŒŒ์†๋˜๊ฑฐ๋‚˜ ์˜ค์—ผ๋˜์—ˆ์„ ๋•Œ ํšจ์œจ์ ์œผ๋กœ ๋Œ€์ฒ˜ํ•˜๊ธฐ ์œ„ํ•ด ํ•„์ˆ˜์ ์ธ ๊ณผ์ •์ด๋‹ค.

 

์–ผํ• ์ƒ๊ฐํ•ด๋ดค์„ ๋•Œ ์‰ฝ์ง€ ์•Š์€ ํ”„๋กœ์ ํŠธ๋ผ๊ณ  ์ƒ๊ฐํ–ˆ๋‹ค. ์ฐจ๋Ÿ‰๋งˆ๋‹ค ์ƒ๊น€์ƒˆ๋„ ๋‹ค๋ฅด๊ณ  ์•ผ์™ธ์—์„œ ์œ ์ €๊ฐ€ ์ง์ ‘ ์ดฌ์˜ํ•œ ์ด๋ฏธ์ง€๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์ด ๋ฐœ์ƒํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. 

 

# ์ง€์†์ ์œผ๋กœ ์„ฑ์žฅํ•˜๋Š” AI ์‹œ์Šคํ…œ

์•ž์„œ ์‚ดํŽด๋ณธ ์นด์…ฐ์–ด๋ง ๋„๋ฉ”์ธ์—์„œ์˜ AI ์‹œ์Šคํ…œ์„ ์ง€์†์ ์œผ๋กœ ์—…๋ฐ์ดํŠธํ•˜๊ธฐ ์œ„ํ•ด ์˜์นด๋Š” "์—”๋“œ ์œ ์ €์˜ ํ”ผ๋“œ๋ฐฑ์„ ๋ชจ๋‘ ๋ชจ์•„ ๋ชจ๋ธ์„ ์žฌํ•™์Šตํ•˜๊ณ  ์‹ถ๋‹ค" ๋ผ๋Š” ์ƒ๊ฐ์„ ํ•˜๊ฒŒ ๋œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด task์— ๋ฌด๊ด€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฑธ๋Ÿฌ๋‚ด๊ณ  ๋ ˆ์ด๋ธ”๋ง ์ž‘์—…์„ ํ•˜๊ณ  ๋ชจ๋ธ์„ ์žฌํ•™์Šต์‹œ์ผœ์•ผ ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์ผ๋ จ์˜ ๊ณผ์ •๋“ค์„ ํšจ์œจ์ ์œผ๋กœ ์ง„ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด ์•„๋ž˜์™€ ๊ฐ™์€ ๋ฐฉ๋ฒ•๋“ค์„ ์‚ฌ์šฉํ–ˆ๋‹ค๊ณ  ํ•œ๋‹ค.

 

1. Task ์™€ ๋ฌด๊ด€ํ•œ ๋ฐ์ดํ„ฐ ํ•„ํ„ฐ๋ง : Out-of-Distribution(OOD) ๊ธฐ์ˆ  ์‚ฌ์šฉ

์ผ๋ฐ˜์ ์ธ Image classifier๋Š” ํ•™์Šต ์‹œ ๋ฏธ๋ฆฌ ์ •์˜๋œ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๋กœ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋ฏธ๋ฆฌ ์ •์˜๋œ ์ข…๋ฅ˜์˜ ์ด๋ฏธ์ง€๊ฐ€ ์•„๋‹ˆ๋ผ๋ฉด ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๊ธฐ๊ฐ€ ๋ถ„๋ฅ˜ํ•ด๋‚ผ ์ˆ˜ ์—†๋‹ค. ์‰ฝ๊ฒŒ ์–˜๊ธฐํ•˜๋ฉด ๊ฐ•์•„์ง€์™€ ๊ณ ์–‘์ด๋ฅผ ๋ถ„๋ฅ˜ํ•ด๋‚ด๋Š” ์‚ฌ์ง„์— ๋‹ค๋ฅธ ๋™๋ฌผ ์‚ฌ์ง„์ด๋‚˜ ์‚ฌ๋ฌผ ์‚ฌ์ง„์„ ๋„ฃ๋”๋ผ๋„ ๊ฐœ์™€ ๊ณ ์–‘์ด ์ค‘ ํ•˜๋‚˜๋กœ๋งŒ ๋ถ„๋ฅ˜ํ•œ๋‹ค๋Š” ๋œป์ด๋‹ค.

 

์นด์…ฐ์–ด๋ง ๋„๋ฉ”์—”์—์„œ๋Š” ์•„๋ฌด๋ž˜๋„ ์œ ์ €๊ฐ€ ์ง์ ‘ ์ดฌ์˜ํ•œ ์‚ฌ์ง„์„ ์—…๋กœ๋“œํ•˜๊ธฐ ๋•Œ๋ฌธ์— task์™€ ๋ฌด๊ด€ํ•œ, ์ฆ‰ ์ฐจ๋Ÿ‰ ์‚ฌ์ง„์ด ์•„๋‹Œ ์ด๋ฏธ์ง€๊ฐ€ ์—…๋กœ๋“œ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ์ด๋Ÿฌํ•œ task์™€ ๋ฌด๊ด€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•„ํ„ฐ๋งํ•˜๊ธฐ ์œ„ํ•ด OOD ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ–ˆ๋‹ค๊ณ  ํ•œ๋‹ค.

 

OOD

OOD ์—ญ์‹œ ์—ฐ๊ตฌ๊ฐ€ ๊ต‰์žฅํžˆ ๋งŽ์ด ์ง„ํ–‰๋œ ๊ธฐ์ˆ ๋กœ ํ•™์Šต ๊ณผ์ •์—์„œ OOD๋ฅผ ๊ฑธ๋Ÿฌ๋‚ด๊ธฐ ์ ํ•ฉํ•œ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•๋„ ์žˆ์ง€๋งŒ ๊ฐ€์žฅ ๊ฐ„๋‹จํ•œ ๋ฐฉ๋ฒ•์€ ์ด๋ฏธ ํ•™์Šต๋œ ๋ชจ๋ธ์—์„œ ์ธํผ๋Ÿฐ์Šค ์‹œ ๋ชจ๋ธ ์ถœ๋ ฅ ๊ฐ’์œผ๋กœ OOD๋ฅผ ๊ฑธ๋Ÿฌ๋‚ด๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์€ ๋ฏธ๋ฆฌ ์ •์˜๋œ ํด๋ž˜์Šค์— ํ•ด๋‹นํ•˜๋Š” confidence socre๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š”๋ฐ ์ด ๊ฐ’์ด ํŠน์ • threshold ๋ณด๋‹ค ๋‚ฎ์€ ๊ฒฝ์šฐ OOD ๋ฐ์ดํ„ฐ๋กœ ๊ฐ„์ฃผํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ์•„๊นŒ ์–˜๊ธฐํ•œ ๊ฐ•์•„์ง€, ๊ณ ์–‘์ด ๋ฌธ์ œ์—์„œ ๊ฐ•์•„์ง€๋„ ๊ณ ์–‘์ด๋„ ์•„๋‹Œ ์ด๋ฏธ์ง€๊ฐ€ ๋“ค์–ด์˜จ๋‹ค๋ฉด ๋‘ ํด๋ž˜์Šค ๋ชจ๋‘ confidence score๊ฐ€ ๋‚ฎ์„ ํ™•๋ฅ ์ด ๋†’์„ํ…Œ๋‹ˆ๊นŒ. ๋ฌผ๋ก  ์ด ๋ฐฉ๋ฒ•์€ ๊ต‰์žฅํžˆ ๊ฐ„๋‹จํ•˜์ง€๋งŒ ์„ฑ๋Šฅ์ด ๊ทธ๋ฆฌ ์ข‹์€ ๋ฐฉ๋ฒ•์€ ์•„๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ์นด์…ฐ์–ด๋ง ๋„๋ฉ”์ธ์—์„œ๋Š” ์ฐจ๋Ÿ‰ ์ด๋ฏธ์ง€์™€ ์ฐจ๋Ÿ‰์ด ์•„๋‹Œ ์ด๋ฏธ์ง€์˜ ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ์ฐจ์ด๊ฐ€ ํฌ๊ธฐ ๋•Œ๋ฌธ์— ๊ฝค ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ๊ฒƒ ๊ฐ™๋‹ค. ์—ญ์‹œ ์‰ฝ์ง€๋งŒ ํšจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ•์ด ์ตœ๊ณ ์˜ ๋ฐฉ๋ฒ•์ด๋‹ค.

 

์ด๋Ÿฌํ•œ OOD Detection ๊ธฐ์ˆ ๋กœ ๋ถ„๋ฆฌ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ„๋„๋กœ ๋ถ„์„ํ•˜๊ณ  ์—”๋“œ์œ ์ €๊ฐ€ ์ƒ์„ฑํ•˜๋Š” ํ”ผ๋“œ๋ฐฑ์˜ ์–‘์ด ๊ฐ์†Œํ•˜๊ณ  ์ธํผ๋Ÿฐ์Šค ๊ฒฐ๊ณผ์˜ ํ€„๋ฆฌํ‹ฐ๊ฐ€ ํ–ฅ์ƒ๋˜๋Š” ์ด์ ์„ ์–ป์—ˆ๋‹ค๊ณ  ํ•œ๋‹ค.

 

 

2. ํšจ์œจ์ ์ธ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ : Data Retriever ์‚ฌ์šฉ

๋ชจ๋ธ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์žฌํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•ด์•ผํ•˜๋Š”๋ฐ ์ด ๊ณผ์ •์—์„œ ๋น„์šฉ๊ณผ ์‹œ๊ฐ„์ด ๋งŽ์ด ์†Œ์š”๋œ๋‹ค. ์•„๋ฌด ๋ฐ์ดํ„ฐ๋‚˜ ์ˆ˜์ง‘ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋ถ„์„ํ•ด์„œ ๋ถ€์กฑํ•œ ๋ถ€๋ถ„์„ ํŒŒ์•…ํ•˜๊ณ  ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ ์œ„์ฃผ๋กœ ์ˆ˜์ง‘ํ•ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๊ฐ€์žฅ ๋ฌด์‹ํ•œ ๋ฐฉ๋ฒ•์€ ์‚ฌ๋žŒ์ด ์—ฌ๋Ÿฌ๋ช… ๋‹ฌ๋ผ๋ถ™์–ด ์ ์ ˆํ•œ ์ด๋ฏธ์ง€๋ฅผ ๊ณจ๋ผ๋‚ด๋Š” ๊ฒƒ์ธ๋ฐ ์ด๊ฑด ์ •๋ง ํž˜๋“  ์ผ์ด๋‹ค.

 

 

์˜์นด์—์„œ๋Š” ์žฌํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ˆ˜์ง‘ํ•˜๊ธฐ ์œ„ํ•ด Image Retriever๋ฅผ ์‚ฌ์šฉํ•˜๋Š”๋ฐ ์‰ฝ๊ฒŒ ๋งํ•ด ์ˆ˜ ๋งŽ์€ ์ด๋ฏธ์ง€ ๋ญ‰์น˜ ์†์—์„œ ์›ํ•˜๋Š” ์ด๋ฏธ์ง€ ์œ ํ˜•์„ ์ฐพ์•„๋‚ด๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ์ด ๋˜ํ•œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜๋Š”๋ฐ, ์šฐ์„  ์ˆ˜๋งŽ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋Š” Unlabeled pool๊ณผ ํƒ€๊ฒŸ ๋ฐ์ดํ„ฐ(์›ํ•˜๋Š” ์œ ํ˜•์˜ ๋ฐ์ดํ„ฐ) ์†Œ๋Ÿ‰์„ ์ค€๋น„ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋‘ ๋ฐ์ดํ„ฐ ์ง‘๋‹จ์„ Image representation ์„ฑ๋Šฅ์ด ์ข‹์€ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์— ํ†ต๊ณผ์‹œ์ผœ ์ด๋ฏธ์ง€๋“ค ๊ฐ„์˜ ์œ ์‚ฌ๋„๋ฅผ ์ธก์ •ํ•œ๋‹ค. ์ฆ‰, ๋ ˆ์ด๋ธ”๋˜์ง€ ์•Š์€ ์ˆ˜๋งŽ์€ ๋ฐ์ดํ„ฐ ์†์—์„œ ๋‚ด๊ฐ€ ๋ฏธ๋ฆฌ ๊ณ ๋ฅธ ํƒ€๊ฒŸ ๋ฐ์ดํ„ฐ์™€ ์œ ์‚ฌ๋„๊ฐ€ ๋†’์€ ์ด๋ฏธ์ง€๋ฅผ ๊ฑธ๋Ÿฌ๋‚ด๋Š” ๊ฒƒ์ด๋‹ค.

 

๋ฌผ๋ก  ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ representation ์„ฑ๋Šฅ์ด ์–ผ๋งˆ๋‚˜ ์ข‹์€์ง€์— ๋”ฐ๋ผ retriever์˜ ์„ฑ๋Šฅ์ด ๋‹ฌ๋ผ์ง€๊ฒ ์ง€๋งŒ 1์ฐจ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฑธ๋Ÿฌ๋‚ด๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๊ต‰์žฅํžˆ ์‚ฌ์šฉํ•ด๋ณผ๋งŒํ•œ ๋ฐฉ๋ฒ•์ด๋ผ ์ƒ๊ฐํ•œ๋‹ค.

 

์ด๋Ÿฌํ•œ Data Retriever ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋น—๋ฐฉ์šธ์ด๋‚˜ ๋ˆˆ์ด ๋ฌป์€ ์ฐจ๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ฐพ์•„๋‚ด์–ด ๋ ˆ์ด๋ธ”๋ง ๋ฆฌ์†Œ์Šค๋ฅผ ์ค„์ด๋Š”๋ฐ ์„ฑ๊ณตํ–ˆ๋‹ค๊ณ  ํ•œ๋‹ค.

 

 

3. ์ƒˆ๋กœ์šด ํด๋ž˜์Šค๋ฅผ ํฌํ•จํ•˜๋Š” AI ๋ชจ๋ธ ์žฌํ•™์Šต : Continual Learning

๋งˆ์ง€๋ง‰์€ ์ƒˆ๋กœ์šด ํด๋ž˜์Šค๋ฅผ ํฌํ•จํ•˜๋Š” AI ๋ชจ๋ธ์„ ํšจ๊ณผ์ ์œผ๋กœ ์žฌํ•™์Šตํ•˜๋Š” ๋ฐฉ๋ฒ•์ธ continual learning์— ๊ด€ํ•œ ๋‚ด์šฉ์ด๋‹ค. ๊ฐ•์•„์ง€์™€ ๊ณ ์–‘์ด๋งŒ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ชจ๋ธ์„ ์žฌํ•™์Šตํ•ด์„œ ๊ฐ•์•„์ง€, ๊ณ ์–‘์ด, ํ† ๋ผ๋ฅผ ๋ถ„๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์„ธ ์ข…๋ฅ˜๋กœ ๋ ˆ์ด๋ธ”๋ง๋œ ๋ฐ์ดํ„ฐ๋กœ ๋ชจ๋ธ์„ ์žฌํ•™์Šตํ•ด์•ผ ํ•˜๋Š”๋ฐ ๋งค๋ฒˆ ๋ชจ๋ธ์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ์žฌํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์ด ๊ต‰์žฅํžˆ ๋‚ญ๋น„์ ์ด๋‹ค. ์ด๋ฏธ ๋ชจ๋ธ์ด ๊ฐ•์•„์ง€์™€ ๊ณ ์–‘์ด๋ฅผ ๋ถ„๋ฆฌํ•˜๊ธฐ ์œ„ํ•œ knowledge๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์œผ๋‹ˆ ํ† ๋ผ๋งŒ์„ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์œ„ํ•œ knowledge๋ฅผ ์ถ•์ ํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ํ•™์Šต์„ ์‹œ์ผœ๋ณด์ž๋Š” ๊ฒƒ์ด continual learning์˜ ๊ฐœ๋…์ด๋‹ค.

 

๊ทธ๋ƒฅ ์ƒˆ๋กœ์šด task๋ฅผ ๊ณ„์† ํ•™์Šต์‹œํ‚ค๋ฉด ์•ˆ๋˜๋ƒ๊ณ ? ํ•˜๋‚˜์˜ ๋ชจ๋ธ์ด ์—ฐ์†์ ์œผ๋กœ ์—ฌ๋Ÿฌ task๋ฅผ ํ•™์Šตํ•˜๋ฉด ๊ฐ€์žฅ ์ตœ๊ทผ์— ํ•™์Šตํ•œ task์˜ ์„ฑ๋Šฅ์€ ๋†’์ง€๋งŒ ์ด์ „ task์˜ ์„ฑ๋Šฅ์€ ๋–จ์–ด์ง€๋Š” catastrophic forgetting์ด๋ผ๋Š” ํ˜„์ƒ์ด ๋ฐœ์ƒํ•œ๋‹ค. ์–ด๋ ค์šด ๋ง์„ ์“ฐ์ง€ ์•Š์•„๋„ ์šฐ๋ฆฌ๋„ ์ˆ˜ํ•™ ๊ณต๋ถ€ํ•˜๋‹ค๊ฐ€ ๊ฐ‘์ž๊ธฐ ์˜์–ด๋ฅผ ๊ณต๋ถ€ํ•˜๋ฉด ํ’€์—ˆ๋˜ ์ˆ˜ํ•™ ๋ฌธ์ œ ์ค‘ ์ผ๋ถ€๋Š” ์žŠ๊ฒŒ ๋˜๋‹ˆ๊นŒ ์‚ฌ๋žŒ๊ณผ ๋น„์Šทํ•˜๋‹ค๊ณ  ๋ณด๋ฉด ๋œ๋‹ค.

 

์•„๋ฌดํŠผ continual learning ์—ฐ๊ตฌ ๋ถ„์•ผ์—์„œ๋Š” ์ด๋Ÿฌํ•œ catastrophic forgetting ํ˜„์ƒ์„ ๋ง‰๊ธฐ ์œ„ํ•œ ์—ฌ๋Ÿฌ ์‹œ๋„๋ฅผ ํ•ด์™”์œผ๋ฉฐ, ๋ณธ ๋ฐœํ‘œ์—์„œ๋Š” ์ธ๊ฐ„์ด ๊ธฐ์–ต์„ ํ˜•์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ชจ์‚ฌํ•ด ์žฅ๊ธฐ๊ธฐ์–ต๊ณผ ๋‹จ๊ธฐ๊ธฐ์–ต๋ฅผ ์ €์žฅํ•ด knowledge๋ฅผ ์ฃผ๊ณ ๋ฐ›๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ–ˆ๋‹ค. 

 

LPG: Lightweight-prompt Learning with General Representation

์ œ์•ˆํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ์žฅ๊ธฐ๊ธฐ์–ต์„ ๋‹ด๋‹นํ•˜๋Š” General Representation ๋ชจ๋“ˆ๊ณผ ๋‹จ๊ธฐ๊ธฐ์–ต์„ ๋‹ด๋‹นํ•˜๋Š” Guiding ๋ชจ๋“ˆ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค. Guiding ๋ชจ๋“ˆ์ด ์ƒˆ๋กœ์šด task๊ฐ€ ๋“ค์–ด์˜ฌ ๋•Œ๋งˆ๋‹ค ์ถœ๋ ฅ feature์˜ variance๋ฅผ ๋ณด๊ณ  task-specificํ•œ ์ง€์‹์„ ์•Œ๋ ค์ค€๋‹ค. ์ด ์—ญ์‹œ General Prepresentation ๋ชจ๋“ˆ์˜ ์„ฑ๋Šฅ์ด ์ œ์•ˆํ•˜๋Š” ๋ฐฉ๋ฒ•์˜ key๊ฐ€ ๋  ๊ฒƒ ๊ฐ™๋‹ค. ๋˜ํ•œ ์ƒˆ๋กœ์šด task๊ฐ€ ๋งŽ์•„์งˆ์ˆ˜๋ก ๋ถˆ๋ฆฌํ•ด์ง€๋Š” ๋ฐฉ๋ฒ•์ด๊ธฐ๋„ ํ•˜๋‹ค.

 

์ œ์•ˆํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๋ฒ ์ด์Šค๋ผ์ธ ๋Œ€๋น„ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค๊ณ  ํ•œ๋‹ค. ์•„์‰ฌ์šด ์ ์€ ์•„์ง ๋ฆฌ์„œ์น˜ ๋‹จ๊ณ„์— ๊ทธ์ณค์œผ๋ฉฐ ํ˜„์‹ค ๋ฌธ์ œ์— ๋„์ž…ํ•˜๊ธฐ์—๋Š” ์•„์ง์€ ์–ด๋ ค์šด์ ์ด ๋งŽ๋‹ค๊ณ  ํ•œ๋‹ค.


์˜ค๋žœ๋งŒ์— ๋น„๋Œ€๋ฉด์œผ๋กœ ๋ฐœํ‘œ๋ฅผ ๋“ค์œผ๋‹ˆ ์ง‘์ค‘๋„ ์ž˜๋˜๊ณ  ๊ธฐ๋ถ„์ด ์ข‹์•˜๋‹ค. ํŠนํžˆ ๋ฐœํ‘œ์ž ๋ถ„์˜ ํ”ผํ‹ฐ ์Šคํ‚ฌ์ด ๊ต‰์žฅํžˆ ์ข‹์•„์„œ ๋ง์”€ํ•ด์ฃผ์‹œ๋Š” ๋‚ด์šฉ์ด ๊ท€์— ์™์™ ๋“ค์–ด์™”๋‹ค.

 

๋‚ด์šฉ์ ์œผ๋กœ๋„ AI ์‹œ์Šคํ…œ์„ ์œ ์ง€ ๋ณด์ˆ˜ํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค๋ฅธ ํšŒ์‚ฌ์—์„œ๋Š” ์–ด๋–ค ๋…ธ๋ ฅ์„ ํ•˜๊ณ  ์žˆ๋Š”์ง€ ์•Œ ์ˆ˜ ์žˆ๋Š” ์‹œ๊ฐ„์ด์–ด์„œ ๊ต‰์žฅํžˆ ์œ ์ตํ–ˆ๋‹ค. ํŠนํžˆ ๋‚ด ๊ธฐ์ค€์—๋Š” Data retriever๋ฅผ ์‚ฌ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐฉ๋ฒ•์ด ์‹ค๋ฌด์— ํ™œ์šฉํ•˜๊ธฐ ์ข‹์„ ๊ฒƒ ๊ฐ™์•„์„œ ๊ต‰์žฅํžˆ ํฅ๋ฏธ๋กœ์› ๋‹ค.

๋ฐ˜์‘ํ˜•