[ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§] (1) κΈ°λ³Έ 기법과 μ˜ˆμ‹œ | Zero-shot One/Few-shot learning | Chain of Thought

2024. 7. 27. 12:42Β·πŸ› Research/NLP & LLM
λ°˜μ‘ν˜•

μ˜€λŠ˜μ€ ν”„λ‘¬ν”„νŠΈ μ—”λ‹ˆμ§€μ–΄λ§μ˜ 기본적인 κΈ°λ²•μ˜ κ°œλ…κ³Ό μ—¬λŸ¬ μ ‘κ·Ό 방식에 λŒ€ν•΄ μ„€λͺ…ν•  μ˜ˆμ •μž…λ‹ˆλ‹€. 이 글을 톡해 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ— λŒ€ν•΄ ν•œ 걸음 더 λ‚˜μ•„κ°ˆ 수 있기λ₯Ό λ°”λžλ‹ˆλ‹€ ~!

 

사싀 였늘 μ‚΄νŽ΄λ³΄λŠ” 기법듀은 ꡉμž₯히 기본적인 κ²ƒλ“€λ‘œ ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆλ§μ„ 쑰금 더 μ‰½κ²Œ 이해할 수 μžˆλ„λ‘ λ„μ™€μ£ΌλŠ” μ •λ„μ˜ λ‚΄μš©μ΄μ—μš”. 쑰금 더 κ³ κΈ‰ 기법도 λ‹€μŒ ν¬μŠ€νŒ…μ—μ„œ μ†Œκ°œν•˜κ³  μžˆμœΌλ‹ˆ λ§Žμ€ 관심 λΆ€νƒλ“œλ €μš”!

 


ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ΄λž€?

ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ€ 인곡지λŠ₯ λͺ¨λΈ, 특히 μ–Έμ–΄ λͺ¨λΈμ΄ μ£Όμ–΄μ§„ μž‘μ—…μ„ 더 잘 μˆ˜ν–‰ν•˜λ„λ‘ μž…λ ₯(ν”„λ‘¬ν”„νŠΈ)을 μ„€κ³„ν•˜κ³  μ‘°μ •ν•˜λŠ” κ³Όμ •μž…λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ—κ²Œ μ •ν™•ν•œ λ§₯락과 지침을 μ œκ³΅ν•˜μ—¬ μ›ν•˜λŠ” κ²°κ³Όλ₯Ό μ–»κΈ° μœ„ν•œ μ€‘μš”ν•œ κΈ°μˆ μž…λ‹ˆλ‹€. ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ˜ μ£Όμš” κΈ°λ²•μœΌλ‘œλŠ” zero-shot, one-shot, few-shot learning, 그리고 chain of thoughtκ°€ μžˆμŠ΅λ‹ˆλ‹€. 이제 각각의 기법을 μžμ„Ένžˆ μ‚΄νŽ΄λ³΄κ² μŠ΅λ‹ˆλ‹€.

 

 

Zero-shot Learning

Zero-shot learning은 λͺ¨λΈμ΄ νŠΉμ • μž‘μ—…μ— λŒ€ν•΄ ν›ˆλ ¨λ˜μ§€ μ•Šμ•˜μŒμ—λ„ λΆˆκ΅¬ν•˜κ³  μ μ ˆν•œ ν”„λ‘¬ν”„νŠΈλ₯Ό 톡해 κ·Έ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ„λ‘ ν•˜λŠ” λ°©λ²•μœΌλ‘œ, λͺ¨λΈμ˜ μΌλ°˜ν™” λŠ₯λ ₯을 ν™œμš©ν•˜λŠ” κΈ°λ²•μ΄μ—μš”.

 

  • ν”„λ‘¬ν”„νŠΈ: "이 λ¬Έμž₯이 긍정적인지 뢀정적인지 λΆ„μ„ν•΄μ€˜: 'λ‚˜λŠ” 였늘 맀우 행볡해.'"
  • λͺ¨λΈμ˜ 응닡: "κΈμ •μ μž…λ‹ˆλ‹€."
  • 이 μ˜ˆμ‹œμ—μ„œ λͺ¨λΈμ€ '긍정적' ν˜Ήμ€ '뢀정적'μ΄λΌλŠ” λ‹¨μ–΄μ˜ 의미λ₯Ό μ΄ν•΄ν•˜κ³ , μƒˆλ‘œμš΄ λ¬Έμž₯에 μ μš©ν•˜μ—¬ κ²°κ³Όλ₯Ό λ„μΆœ

 

 

One-shot Learning

One-shot learning은 λͺ¨λΈμ—κ²Œ νŠΉμ • μž‘μ—…μ˜ μ˜ˆμ‹œλ₯Ό ν•˜λ‚˜ μ œκ³΅ν•˜μ—¬, λͺ¨λΈμ΄ κ·Έ μ˜ˆμ‹œλ₯Ό λ°”νƒ•μœΌλ‘œ μœ μ‚¬ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜κ²Œ ν•˜λŠ” λ°©λ²•μž…λ‹ˆλ‹€.

 

  • ν”„λ‘¬ν”„νŠΈ: "λ‹€μŒ λ¬Έμž₯을 μ˜μ–΄λ‘œ λ²ˆμ—­ν•΄μ€˜. μ˜ˆμ‹œ: 'μ•ˆλ…•ν•˜μ„Έμš”' -> 'Hello'  'μ €λŠ” ν•™μƒμž…λ‹ˆλ‹€' ->"
  • λͺ¨λΈμ˜ 응닡: "'I am a student.'"
  • 이 경우 λͺ¨λΈμ€ ν•œ 개의 μ˜ˆμ‹œλ₯Ό 보고 μƒˆλ‘œμš΄ λ¬Έμž₯에 λŒ€ν•΄ μœ μ‚¬ν•œ λ²ˆμ—­ μž‘μ—…μ„ μˆ˜ν–‰

 

Few-shot Learning

Few-shot learning은 λͺ¨λΈμ—κ²Œ μ—¬λŸ¬ 개의 μ˜ˆμ‹œλ₯Ό μ œκ³΅ν•˜μ—¬, λͺ¨λΈμ΄ 이 μ˜ˆμ‹œλ“€μ„ λ°”νƒ•μœΌλ‘œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜κ²Œ ν•˜λŠ” λ°©λ²•μž…λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ—κ²Œ 더 λ§Žμ€ λ§₯락을 μ œκ³΅ν•˜μ—¬ μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 데 μœ μš©ν•©λ‹ˆλ‹€.

 

  • ν”„λ‘¬ν”„νŠΈ: "λ‹€μŒ λ¬Έμž₯을 μ˜μ–΄λ‘œ λ²ˆμ—­ν•΄μ€˜. μ˜ˆμ‹œ:'μ•ˆλ…•ν•˜μ„Έμš”' -> 'Hello', 'μ €λŠ” ν•™μƒμž…λ‹ˆλ‹€' -> 'I am a student', '였늘 날씨가 μ’‹λ„€μš”' -> 'The weather is nice today', '컀피 ν•œ μž” μ£Όμ„Έμš”' ->"
  • λͺ¨λΈμ˜ 응닡: "'Please give me a cup of coffee.'"
  • 이 μ˜ˆμ‹œμ—μ„œλŠ” μ—¬λŸ¬ 개의 λ²ˆμ—­ μ˜ˆμ‹œλ₯Ό μ œκ³΅ν•˜μ—¬, λͺ¨λΈμ΄ λ”μš± μ •ν™•ν•˜κ²Œ λ²ˆμ—­μ„ μˆ˜ν–‰ν•  수 있게 함

 

Chain of Thought

Chain of thought 기법은 λ³΅μž‘ν•œ 문제λ₯Ό ν•΄κ²°ν•  λ•Œ μœ μš©ν•œ μ ‘κ·Ό λ°©μ‹μž…λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ΄ 문제λ₯Ό λ‹¨κ³„λ³„λ‘œ ν•΄κ²°ν•  수 μžˆλ„λ‘ ν”„λ‘¬ν”„νŠΈλ₯Ό κ΅¬μ„±ν•˜λŠ” λ°©λ²•μž…λ‹ˆλ‹€.

 

  • ν”„λ‘¬ν”„νŠΈ: "μ•„λž˜ 문제λ₯Ό λ‹¨κ³„λ³„λ‘œ 해결해봐: 문제: 'λ§Œμ•½ 사과가 5개 있고, 3개λ₯Ό 더 μ‚°λ‹€λ©΄ 총 λͺ‡ 개의 사과가 μžˆλ‚˜μš”?', 1단계: 'ν˜„μž¬ μ‚¬κ³Όμ˜ 개수λ₯Ό μ„Έμ–΄λ³΄μž.', 2단계: 'μƒˆλ‘œ μ‚° μ‚¬κ³Όμ˜ 개수λ₯Ό λ”ν•˜μž.', 3단계: '총 μ‚¬κ³Όμ˜ 개수λ₯Ό κ³„μ‚°ν•˜μž.'"
  • λͺ¨λΈμ˜ 응닡: "ν˜„μž¬ μ‚¬κ³ΌλŠ” 5κ°œμ΄λ‹€. μƒˆλ‘œ μ‚° μ‚¬κ³ΌλŠ” 3κ°œμ΄λ‹€. 총 μ‚¬κ³Όμ˜ κ°œμˆ˜λŠ” 5 + 3 = 8κ°œμ΄λ‹€."
  • 이 경우 λͺ¨λΈμ€ 문제λ₯Ό λ‹¨κ³„λ³„λ‘œ λ‚˜λˆ„μ–΄ μƒκ°ν•˜κ³  ν•΄κ²°ν•˜λŠ” 과정을 톡해 μ •ν™•ν•œ 닡을 λ„μΆœν•  수 있음

 

ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ€ AI λͺ¨λΈμ˜ μ„±λŠ₯을 μ΅œλŒ€ν•œ λŒμ–΄λ‚΄κΈ° μœ„ν•œ μ€‘μš”ν•œ κΈ°μˆ μ΄μ—μš”. 였늘 μ„€λͺ…λ“œλ¦° Zero-shot, one-shot, few-shot learning, 그리고 chain of thought 기법은 각각 λ‹€λ₯Έ μƒν™©μ—μ„œ μœ μš©ν•˜κ²Œ μ‚¬μš©λ  수 μžˆλŠ”λ°μš”. 이 글을 톡해 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ˜ κΈ°λ³Έ κ°œλ…κ³Ό λ‹€μ–‘ν•œ μ ‘κ·Ό 방식을 μ΄ν•΄ν•˜λŠ” 데 도움이 λ˜μ—ˆκΈ°λ₯Ό λ°”λžλ‹ˆλ‹€. 

λ°˜μ‘ν˜•

'πŸ› Research > NLP & LLM' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

[ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§] (3) κ³ κΈ‰ 기법: Few-shot, Chain-of-thought, Self-consistency, Selection-inference, Least-to-most, ReAct, Self-evaluation  (0) 2024.07.27
[ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§] (2) ν”„λ‘¬ν”„νŠΈ 섀계 핡심 κ°œλ… : Role (μ—­ν• ) Policy (μ •μ±…) Audience (λŒ€μƒ) Knowledge (지식) Format (ν˜•μ‹) Task (μž‘μ—…) Example (μ˜ˆμ‹œ)  (0) 2024.07.27
LLM ν”„λ‘¬ν”„νŠΈ μ—”λ‹ˆμ§€μ–΄λ§, 그게 λŒ€μ²΄ 뭔데? λ‚˜λ„ μ•Œμ•„μ•Όν•΄!?  (0) 2024.07.26
[NLP] BERT 간단 μ„€λͺ… | Bi-Directional LM | μ–‘λ°©ν–₯ μ–Έμ–΄ λͺ¨λΈ  (0) 2023.09.25
[μ˜€ν”ˆ μ†ŒμŠ€] BERTλ₯Ό μ΄μš©ν•œ ν•œκ΅­μ–΄ 개체λͺ… 인식 | NER (Named Entity Recognition)  (0) 2022.12.15
'πŸ› Research/NLP & LLM' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€
  • [ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§] (3) κ³ κΈ‰ 기법: Few-shot, Chain-of-thought, Self-consistency, Selection-inference, Least-to-most, ReAct, Self-evaluation
  • [ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§] (2) ν”„λ‘¬ν”„νŠΈ 섀계 핡심 κ°œλ… : Role (μ—­ν• ) Policy (μ •μ±…) Audience (λŒ€μƒ) Knowledge (지식) Format (ν˜•μ‹) Task (μž‘μ—…) Example (μ˜ˆμ‹œ)
  • LLM ν”„λ‘¬ν”„νŠΈ μ—”λ‹ˆμ§€μ–΄λ§, 그게 λŒ€μ²΄ 뭔데? λ‚˜λ„ μ•Œμ•„μ•Όν•΄!?
  • [NLP] BERT 간단 μ„€λͺ… | Bi-Directional LM | μ–‘λ°©ν–₯ μ–Έμ–΄ λͺ¨λΈ
뭅즀
뭅즀
AI 기술 λΈ”λ‘œκ·Έ
    λ°˜μ‘ν˜•
  • 뭅즀
    CV DOODLE
    뭅즀
  • 전체
    였늘
    μ–΄μ œ
  • 곡지사항

    • ✨ About Me
    • λΆ„λ₯˜ 전체보기 (199)
      • πŸ“– Fundamentals (33)
        • Computer Vision (9)
        • 3D vision & Graphics (6)
        • AI & ML (15)
        • NLP (2)
        • etc. (1)
      • πŸ› Research (64)
        • Deep Learning (7)
        • Image Classification (2)
        • Detection & Segmentation (17)
        • OCR (7)
        • Multi-modal (4)
        • Generative AI (6)
        • 3D Vision (2)
        • Material & Texture Recognit.. (8)
        • NLP & LLM (11)
        • etc. (0)
      • 🌟 AI & ML Tech (7)
        • AI & ML μΈμ‚¬μ΄νŠΈ (7)
      • πŸ’» Programming (86)
        • Python (18)
        • Computer Vision (12)
        • LLM (4)
        • AI & ML (18)
        • Database (3)
        • Apache Airflow (6)
        • Docker & Kubernetes (14)
        • μ½”λ”© ν…ŒμŠ€νŠΈ (4)
        • C++ (1)
        • etc. (6)
      • πŸ’¬ ETC (3)
        • μ±… 리뷰 (3)
  • 링크

  • 인기 κΈ€

  • νƒœκ·Έ

    airflow
    CNN
    deep learning
    AI
    λ”₯λŸ¬λ‹
    material recognition
    pytorch
    OpenCV
    컴퓨터비전
    object detection
    3D Vision
    GPT
    파이썬
    VLP
    Computer Vision
    OpenAI
    κ°μ²΄κ²€μΆœ
    객체 κ²€μΆœ
    Image Classification
    OCR
    nlp
    multi-modal
    Python
    Text recognition
    도컀
    ChatGPT
    segmentation
    LLM
    ν”„λ‘¬ν”„νŠΈμ—”μ§€λ‹ˆμ–΄λ§
    pandas
  • 졜근 λŒ“κΈ€

  • 졜근 κΈ€

  • hELLOΒ· Designed Byμ •μƒμš°.v4.10.3
뭅즀
[ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§] (1) κΈ°λ³Έ 기법과 μ˜ˆμ‹œ | Zero-shot One/Few-shot learning | Chain of Thought
μƒλ‹¨μœΌλ‘œ

ν‹°μŠ€ν† λ¦¬νˆ΄λ°”