λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
🌟 AI & ML Tech/Prompt Engineering

[ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§] (1) κΈ°λ³Έ 기법과 μ˜ˆμ‹œ | Zero-shot One/Few-shot learning | Chain of Thought

by 뭅즀 2024. 7. 27.
λ°˜μ‘ν˜•

μ˜€λŠ˜μ€ ν”„λ‘¬ν”„νŠΈ μ—”λ‹ˆμ§€μ–΄λ§μ˜ 기본적인 κΈ°λ²•μ˜ κ°œλ…κ³Ό μ—¬λŸ¬ μ ‘κ·Ό 방식에 λŒ€ν•΄ μ„€λͺ…ν•  μ˜ˆμ •μž…λ‹ˆλ‹€. 이 글을 톡해 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ— λŒ€ν•΄ ν•œ 걸음 더 λ‚˜μ•„κ°ˆ 수 있기λ₯Ό λ°”λžλ‹ˆλ‹€ ~!

 

사싀 였늘 μ‚΄νŽ΄λ³΄λŠ” 기법듀은 ꡉμž₯히 기본적인 κ²ƒλ“€λ‘œ ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆλ§μ„ 쑰금 더 μ‰½κ²Œ 이해할 수 μžˆλ„λ‘ λ„μ™€μ£ΌλŠ” μ •λ„μ˜ λ‚΄μš©μ΄μ—μš”. 쑰금 더 κ³ κΈ‰ 기법도 λ‹€μŒ ν¬μŠ€νŒ…μ—μ„œ μ†Œκ°œν•˜κ³  μžˆμœΌλ‹ˆ λ§Žμ€ 관심 λΆ€νƒλ“œλ €μš”!

 


ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ΄λž€?

ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ€ 인곡지λŠ₯ λͺ¨λΈ, 특히 μ–Έμ–΄ λͺ¨λΈμ΄ 주어진 μž‘μ—…μ„ 더 잘 μˆ˜ν–‰ν•˜λ„λ‘ μž…λ ₯(ν”„λ‘¬ν”„νŠΈ)을 μ„€κ³„ν•˜κ³  μ‘°μ •ν•˜λŠ” κ³Όμ •μž…λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ—κ²Œ μ •ν™•ν•œ λ§₯락과 지침을 μ œκ³΅ν•˜μ—¬ μ›ν•˜λŠ” κ²°κ³Όλ₯Ό μ–»κΈ° μœ„ν•œ μ€‘μš”ν•œ κΈ°μˆ μž…λ‹ˆλ‹€. ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ˜ μ£Όμš” κΈ°λ²•μœΌλ‘œλŠ” zero-shot, one-shot, few-shot learning, 그리고 chain of thoughtκ°€ μžˆμŠ΅λ‹ˆλ‹€. 이제 각각의 기법을 μžμ„Ένžˆ μ‚΄νŽ΄λ³΄κ² μŠ΅λ‹ˆλ‹€.

 

 

Zero-shot Learning

Zero-shot learning은 λͺ¨λΈμ΄ νŠΉμ • μž‘μ—…μ— λŒ€ν•΄ ν›ˆλ ¨λ˜μ§€ μ•Šμ•˜μŒμ—λ„ λΆˆκ΅¬ν•˜κ³  μ μ ˆν•œ ν”„λ‘¬ν”„νŠΈλ₯Ό 톡해 κ·Έ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ„λ‘ ν•˜λŠ” λ°©λ²•μœΌλ‘œ, λͺ¨λΈμ˜ μΌλ°˜ν™” λŠ₯λ ₯을 ν™œμš©ν•˜λŠ” κΈ°λ²•μ΄μ—μš”.

 

  • ν”„λ‘¬ν”„νŠΈ: "이 λ¬Έμž₯이 긍정적인지 뢀정적인지 λΆ„μ„ν•΄μ€˜: 'λ‚˜λŠ” 였늘 맀우 행볡해.'"
  • λͺ¨λΈμ˜ 응닡: "κΈμ •μ μž…λ‹ˆλ‹€."
  • 이 μ˜ˆμ‹œμ—μ„œ λͺ¨λΈμ€ '긍정적' ν˜Ήμ€ '뢀정적'μ΄λΌλŠ” λ‹¨μ–΄μ˜ 의미λ₯Ό μ΄ν•΄ν•˜κ³ , μƒˆλ‘œμš΄ λ¬Έμž₯에 μ μš©ν•˜μ—¬ κ²°κ³Όλ₯Ό λ„μΆœ

 

 

One-shot Learning

One-shot learning은 λͺ¨λΈμ—κ²Œ νŠΉμ • μž‘μ—…μ˜ μ˜ˆμ‹œλ₯Ό ν•˜λ‚˜ μ œκ³΅ν•˜μ—¬, λͺ¨λΈμ΄ κ·Έ μ˜ˆμ‹œλ₯Ό λ°”νƒ•μœΌλ‘œ μœ μ‚¬ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜κ²Œ ν•˜λŠ” λ°©λ²•μž…λ‹ˆλ‹€.

 

  • ν”„λ‘¬ν”„νŠΈ: "λ‹€μŒ λ¬Έμž₯을 μ˜μ–΄λ‘œ λ²ˆμ—­ν•΄μ€˜. μ˜ˆμ‹œ: 'μ•ˆλ…•ν•˜μ„Έμš”' -> 'Hello'  'μ €λŠ” ν•™μƒμž…λ‹ˆλ‹€' ->"
  • λͺ¨λΈμ˜ 응닡: "'I am a student.'"
  • 이 경우 λͺ¨λΈμ€ ν•œ 개의 μ˜ˆμ‹œλ₯Ό 보고 μƒˆλ‘œμš΄ λ¬Έμž₯에 λŒ€ν•΄ μœ μ‚¬ν•œ λ²ˆμ—­ μž‘μ—…μ„ μˆ˜ν–‰

 

Few-shot Learning

Few-shot learning은 λͺ¨λΈμ—κ²Œ μ—¬λŸ¬ 개의 μ˜ˆμ‹œλ₯Ό μ œκ³΅ν•˜μ—¬, λͺ¨λΈμ΄ 이 μ˜ˆμ‹œλ“€μ„ λ°”νƒ•μœΌλ‘œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜κ²Œ ν•˜λŠ” λ°©λ²•μž…λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ—κ²Œ 더 λ§Žμ€ λ§₯락을 μ œκ³΅ν•˜μ—¬ μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 데 μœ μš©ν•©λ‹ˆλ‹€.

 

  • ν”„λ‘¬ν”„νŠΈ: "λ‹€μŒ λ¬Έμž₯을 μ˜μ–΄λ‘œ λ²ˆμ—­ν•΄μ€˜. μ˜ˆμ‹œ:'μ•ˆλ…•ν•˜μ„Έμš”' -> 'Hello', 'μ €λŠ” ν•™μƒμž…λ‹ˆλ‹€' -> 'I am a student', '였늘 날씨가 μ’‹λ„€μš”' -> 'The weather is nice today', '컀피 ν•œ μž” μ£Όμ„Έμš”' ->"
  • λͺ¨λΈμ˜ 응닡: "'Please give me a cup of coffee.'"
  • 이 μ˜ˆμ‹œμ—μ„œλŠ” μ—¬λŸ¬ 개의 λ²ˆμ—­ μ˜ˆμ‹œλ₯Ό μ œκ³΅ν•˜μ—¬, λͺ¨λΈμ΄ λ”μš± μ •ν™•ν•˜κ²Œ λ²ˆμ—­μ„ μˆ˜ν–‰ν•  수 있게 함

 

Chain of Thought

Chain of thought 기법은 λ³΅μž‘ν•œ 문제λ₯Ό ν•΄κ²°ν•  λ•Œ μœ μš©ν•œ μ ‘κ·Ό λ°©μ‹μž…λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ΄ 문제λ₯Ό λ‹¨κ³„λ³„λ‘œ ν•΄κ²°ν•  수 μžˆλ„λ‘ ν”„λ‘¬ν”„νŠΈλ₯Ό κ΅¬μ„±ν•˜λŠ” λ°©λ²•μž…λ‹ˆλ‹€.

 

  • ν”„λ‘¬ν”„νŠΈ: "μ•„λž˜ 문제λ₯Ό λ‹¨κ³„λ³„λ‘œ 해결해봐: 문제: 'λ§Œμ•½ 사과가 5개 있고, 3개λ₯Ό 더 μ‚°λ‹€λ©΄ 총 λͺ‡ 개의 사과가 μžˆλ‚˜μš”?', 1단계: 'ν˜„μž¬ μ‚¬κ³Όμ˜ 개수λ₯Ό μ„Έμ–΄λ³΄μž.', 2단계: 'μƒˆλ‘œ μ‚° μ‚¬κ³Όμ˜ 개수λ₯Ό λ”ν•˜μž.', 3단계: '총 μ‚¬κ³Όμ˜ 개수λ₯Ό κ³„μ‚°ν•˜μž.'"
  • λͺ¨λΈμ˜ 응닡: "ν˜„μž¬ μ‚¬κ³ΌλŠ” 5κ°œμ΄λ‹€. μƒˆλ‘œ μ‚° μ‚¬κ³ΌλŠ” 3κ°œμ΄λ‹€. 총 μ‚¬κ³Όμ˜ κ°œμˆ˜λŠ” 5 + 3 = 8κ°œμ΄λ‹€."
  • 이 경우 λͺ¨λΈμ€ 문제λ₯Ό λ‹¨κ³„λ³„λ‘œ λ‚˜λˆ„μ–΄ μƒκ°ν•˜κ³  ν•΄κ²°ν•˜λŠ” 과정을 톡해 μ •ν™•ν•œ 닡을 λ„μΆœν•  수 있음

 

ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ€ AI λͺ¨λΈμ˜ μ„±λŠ₯을 μ΅œλŒ€ν•œ λŒμ–΄λ‚΄κΈ° μœ„ν•œ μ€‘μš”ν•œ κΈ°μˆ μ΄μ—μš”. 였늘 μ„€λͺ…λ“œλ¦° Zero-shot, one-shot, few-shot learning, 그리고 chain of thought 기법은 각각 λ‹€λ₯Έ μƒν™©μ—μ„œ μœ μš©ν•˜κ²Œ μ‚¬μš©λ  수 μžˆλŠ”λ°μš”. 이 글을 톡해 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ˜ κΈ°λ³Έ κ°œλ…κ³Ό λ‹€μ–‘ν•œ μ ‘κ·Ό 방식을 μ΄ν•΄ν•˜λŠ” 데 도움이 λ˜μ—ˆκΈ°λ₯Ό λ°”λžλ‹ˆλ‹€. 

λ°˜μ‘ν˜•