[ν둬ννΈ μμ§λμ΄λ§] (3) κ³ κΈ κΈ°λ²: Few-shot, Chain-of-thought, Self-consistency, Selection-inference, Least-to-most, ReAct, Self-evaluation
μ΄λ² ν¬μ€ν μμλ ν둬ννΈ μμ§λμ΄λ§μ κ³ κΈ κΈ°λ²λ€μ λν΄ μμλ³΄λ €κ³ ν΄μ. μ΄ κΈ°λ²λ€μ AI λͺ¨λΈμ΄ 볡μ‘ν μμ μ λ ν¨κ³Όμ μΌλ‘ μνν μ μλλ‘ λμμ£Όλ μ€μν λꡬλ€μ΄μμ. νΉν few-shot examples, chain-of-thought, self-consistency, selection-inference, least-to-most, react, self-evaluation κ°μ κΈ°λ²λ€μ λ€λ£° κ±°μμ. κ°κ°μ κΈ°λ²μ μ΄ν΄νκ³ μ μ ν νμ©νλ©΄, λ μ ννκ³ μ μ©ν AI μλ΅μ μ»μ μ μμ΄μ. κ·ΈλΌ, κ° κΈ°λ²λ€μ νλμ© μ΄ν΄λ³ΌκΉμ?
Few-shot Examples
Few-shot examplesλ λͺ¨λΈμκ² μ¬λ¬ κ°μ μμλ₯Ό μ 곡ν΄μ, λͺ¨λΈμ΄ μ΄ μμλ€μ λ°νμΌλ‘ μμ μ μννκ² νλ λ°©λ²μ΄μμ. μ΄λ λͺ¨λΈμκ² λ λ§μ λ§₯λ½μ μ 곡ν΄μ μ±λ₯μ ν₯μμν€λ λ° μ μ©ν΄μ.
- Zero-shot : μμ λ₯Ό μ 곡νμ§ μμ
- One-shot : νλμ μμ μ 곡
- Few-shot : μ¬λ¬ μμ λ₯Ό μ 곡
μμ
- ν둬ννΈ: "λ€μ λ¬Έμ₯μ μμ΄λ‘ λ²μν΄μ€. μμ: 'μλ νμΈμ' -> 'Hello', 'μ λ νμμ΄μμ' -> 'I am a student', 'μ€λ λ μ¨κ° μ’λ€μ' -> 'The weather is nice today', 'μ»€νΌ ν μ μ£ΌμΈμ' ->"
- λͺ¨λΈμ μλ΅: "'Please give me a cup of coffee.'"
- ν둬ννΈ
- μ λ§ λ©μ§λ€μ! -> λΆμ
- μ΄κ±΄ λμλ€! -> κΈμ
- μμ° κ·Έ μν μ λ§ λ©μ‘μ΄μ! -> κΈμ
- μ λ§ λμ°ν μΌμμ΄! ->
- λͺ¨λΈμ μλ΅ : λΆμ
Chain-of-Thought (CoT)
Chain-of-thought κΈ°λ²μ 볡μ‘ν λ¬Έμ λ₯Ό ν΄κ²°ν λ μ μ©ν μ κ·Ό λ°©μμ΄μμ. μ΄λ λͺ¨λΈμ΄ λ¬Έμ λ₯Ό λ¨κ³λ³λ‘ ν΄κ²°ν μ μλλ‘ ν둬ννΈλ₯Ό ꡬμ±νλ λ°©λ²μ΄μμ. λ¨μν μ§λ¬Έμ λμ§κΈ° λ³΄λ€ λ¨κ³λ₯Ό λλμ΄ μ§λ¬Έμ νλ λ°©μ.
μμ
- ν둬ννΈ: "μλ λ¬Έμ λ₯Ό λ¨κ³λ³λ‘ ν΄κ²°ν΄λ΄: λ¬Έμ : 'λ§μ½ μ¬κ³Όκ° 5κ° μκ³ , 3κ°λ₯Ό λ μ°λ€λ©΄ μ΄ λͺ κ°μ μ¬κ³Όκ° μλμ?', 1λ¨κ³: 'νμ¬ μ¬κ³Όμ κ°μλ₯Ό μΈμ΄λ³΄μ.', 2λ¨κ³: 'μλ‘ μ° μ¬κ³Όμ κ°μλ₯Ό λνμ.', 3λ¨κ³: 'μ΄ μ¬κ³Όμ κ°μλ₯Ό κ³μ°νμ.'"
- λͺ¨λΈμ μλ΅: "νμ¬ μ¬κ³Όλ 5κ°μμ. μλ‘ μ° μ¬κ³Όλ 3κ°μμ. μ΄ μ¬κ³Όμ κ°μλ 5 + 3 = 8κ°μμ."
Self-Consistency
Self-consistencyλ λͺ¨λΈμ μλ΅ μΌκ΄μ±μ μ μ§νλλ‘ νλ κΈ°λ²μ΄μμ. μ΄λ λμΌν μ§λ¬Έμ λν΄ μ¬λ¬ λ² λ΅λ³μ μμ±νκ³ , κ°μ₯ μΌκ΄λ λ΅λ³μ μ ννλ λ°©λ²μ΄μμ. λ¬Όλ‘ λ€μν μΆλ‘ κ²°κ³Όλ₯Ό μ 곡ν΄μΌ νλ―λ‘ ν ν°μλ₯Ό λ§μ΄ μ¬μ©νλ€λ λ¨μ κ³Ό κ²°κ³Ό μ·¨ν©μ μν νμ²λ¦¬κ° νμνλ€λ λ¨μ μ΄ μμ΄μ.
μμ
- ν둬ννΈ: "λ€μ μ§λ¬Έμ λ΅λ³ν΄μ€: 'μ§κ΅¬μ λλ λ μΌλ§μΈκ°μ?'"
- λͺ¨λΈμ μλ΅: μ¬λ¬ λ²μ μ€ν κ²°κ³Ό κ°κ° "40,075 km", "40,075 km", "40,075 km"
μ΄ κ²½μ° λͺ¨λΈμ μΌκ΄λ λ΅λ³μΈ "40,075 km"λ₯Ό μ νν΄ μ λ’°λλ₯Ό λμΌ μ μμ΄μ.
Selection-Inference
Selection-Inferenceλ 볡μ‘ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μ¬λ¬ μΆλ‘ λ¨κ³λ₯Ό κ±°μ³ μ΅μ’ λ΅μ λμΆνλ κΈ°λ²μ΄μμ. μ΄ κ³Όμ μμλ κ° λ¨κ³μμ κ°λ₯ν μ¬λ¬ ν보 λ΅λ³ μ€μμ μ΅μ μ λ΅λ³μ μ ννκ³ , λ€μ λ¨κ³μ μΆλ‘ μ μ΄μ΄κ°λ λ°©μμΌλ‘ μ§νλΌμ. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ΄ λ¬Έμ λ₯Ό 체κ³μ μΌλ‘ μ κ·Όνκ³ , λ³΄λ€ μ νν κ²°κ³Όλ₯Ό μ»μ μ μκ² λΌμ.
μμ
λ¬Έμ : "Aμ¨λ μ§κ°μ μμ΄λ²λ Έμ΄μ. κ·Έλ λ§μ§λ§μΌλ‘ μΉ΄νμμ μ§κ°μ μ¬μ©νμ΄μ. μ§κ°μ μ΄λμ μμ κ°λ₯μ±μ΄ κ°μ₯ λμκΉμ?"
Selection-Inference κΈ°λ²μ μ μ©ν΄ λ³Όκ²μ.
λ¨κ³ 1: μ 보 μμ§
- Aμ¨κ° μ§κ°μ μ¬μ©ν λ§μ§λ§ μ₯μλ μ΄λμΈκ°μ?
- λ΅λ³ ν보
- μΉ΄ν
- μ§
- νμ¬
- μ νλ λ΅λ³: μΉ΄ν
λ¨κ³ 2: μΆκ° μ 보 μμ§
- Aμ¨κ° μΉ΄νμμ 무μμ νλμ§ μμλ΄ μλ€.
- λ΅λ³ ν보
- 컀νΌλ₯Ό λ§μ ¨λ€
- μΉκ΅¬λ₯Ό λ§λ¬λ€
- μ μ©μΉ΄λλ‘ κ²°μ νλ€
- μ νλ λ΅λ³: μ μ©μΉ΄λλ‘ κ²°μ νλ€
λ¨κ³ 3: μ΅μ’ μΆλ‘
- Aμ¨κ° μ μ©μΉ΄λλ‘ κ²°μ ν ν μ§κ°μ μ΄λμ λμμ κ°λ₯μ±μ΄ κ°μ₯ λμκΉμ?
- λ΅λ³ ν보
- ν μ΄λΈ μ
- κ³μ°λ
- μ£Όλ¨Έλ μ
- μ νλ λ΅λ³: κ³μ°λ
μ΅μ’ μ μΌλ‘, Selection-Inference κΈ°λ²μ ν΅ν΄ Aμ¨μ μ§κ°μ΄ κ³μ°λμ μμ κ°λ₯μ±μ΄ κ°μ₯ λλ€λ κ²°λ‘ μ λλ¬νμ΄μ.
Least-to-Most
Least-to-most κΈ°λ²μ λ¬Έμ λ₯Ό μμ λΆλΆμΌλ‘ λλμ΄ λ¨κ³μ μΌλ‘ ν΄κ²°νλ λ°©λ²μ΄μμ. μ΄λ λͺ¨λΈμ΄ 볡μ‘ν λ¬Έμ λ₯Ό λ μ½κ² ν΄κ²°ν μ μλλ‘ λλ μ κ·Ό λ°©μμ΄μμ. μ¬λ¬ νμ μμ λ€μ νλ²μ νλμ© ν΄κ²°νκ³ , μ΄μ μ μμ±ν λ΅μ λ€μ λ¬Έμ λ₯Ό ν΄κ²°νλλ° μ¬μ©.
μμ
- ν둬ννΈ: "λ€μ λ¬Έμ λ₯Ό λ¨κ³λ³λ‘ ν΄κ²°ν΄λ΄: 'ν μμμ 12κ°μ μ¬κ³Όκ° λ€μ΄μκ³ , 5κ°μ μμκ° μλ€λ©΄ μ΄ λͺ κ°μ μ¬κ³Όκ° μλμ?' 1λ¨κ³: 'ν μμμ λͺ κ°μ μ¬κ³Όκ° μλμ§ νμΈν΄λ³΄μ.' 2λ¨κ³: 'μμμ μλ₯Ό νμΈν΄λ³΄μ.' 3λ¨κ³: 'μ΄ μ¬κ³Όμ κ°μλ₯Ό κ³μ°νμ.'"
- λͺ¨λΈμ μλ΅: "ν μμμ 12κ°μ μ¬κ³Όκ° μμ΄μ. 5κ°μ μμκ° μμ΄μ. μ΄ μ¬κ³Όμ κ°μλ 12 * 5 = 60κ°μμ."
μ΄ κΈ°λ²μ λ¬Έμ λ₯Ό λ¨κ³λ³λ‘ λλμ΄ ν΄κ²°ν¨μΌλ‘μ¨ λͺ¨λΈμ΄ λ μ ννκ² μμ μ μνν μ μκ² ν΄μ€μ.
ReAct (Reason and Act)
ReActλ λͺ¨λΈμ΄ νΉμ λ¬Έμ μ λν΄ μ¬κ³ νκ³ νλνλ κ³Όμ μ ν΅ν΄ λ¬Έμ λ₯Ό ν΄κ²°νλλ‘ μ λνλ κΈ°λ²μ΄μμ. μ΄λ λͺ¨λΈμ΄ λ¬Έμ λ₯Ό ν΄κ²°νλ λ Όλ¦¬μ λ¨κ³λ₯Ό κ±°μΉλλ‘ λμμ€μ. μ΄λ₯Ό ν΅ν΄ μμ€ν μ νλμ λν κ³νμ μμ±, μ μ§, μ‘°μ νλ λμμ μΈλΆ νκ²½(e.g. μν€λνΌμ)κ³Ό μνΈ μμ©μ ν΅ν΄ μΆλ‘ μ μΆκ° μ 보λ₯Ό ν΅ν© ν μ μμ΄μ. νμν μ 보λ₯Ό μΈλΆ νκ²½μμ κ²μν΄μμ λ¬Έμ ν΄κ²°μ λμμ λ°λ κ²μ΄μ£ .
μμ
- ν둬ννΈ: "μλ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν λ Όλ¦¬μ λ¨κ³λ₯Ό μκ°νκ³ λ΅λ³ν΄μ€: 'λ§μ½ ν μ¬λμ΄ ν루μ 2리ν°μ λ¬Όμ λ§μ λ€λ©΄, μΌμ£ΌμΌ λμ λͺ 리ν°μ λ¬Όμ λ§μ€κΉμ?' 1λ¨κ³: 'ν루μ λ§μλ λ¬Όμ μμ νμΈν΄λ³΄μ.' 2λ¨κ³: 'μΌμ£ΌμΌ λμμ μΌμλ₯Ό κ³μ°ν΄λ³΄μ.' 3λ¨κ³: 'μ΄ λ¬Όμ μμ κ³μ°νμ.'"
- λͺ¨λΈμ μλ΅: "ν루μ 2리ν°μ λ¬Όμ λ§μ μ. μΌμ£ΌμΌμ 7μΌμ΄μμ. μ΄ λ¬Όμ μμ 2 * 7 = 14리ν°μμ."
μ΄ κΈ°λ²μ λͺ¨λΈμ΄ λ¬Έμ λ₯Ό ν΄κ²°νλ κ³Όμ μμ λ Όλ¦¬μ λ¨κ³λ₯Ό κ³ λ €νλλ‘ μ λν΄μ.
Self-Evaluation
Self-evaluationμ λͺ¨λΈμ΄ μ€μ€λ‘ μμ μ μλ΅μ νκ°νκ³ κ°μ ν μ μλλ‘ νλ κΈ°λ²μ΄μμ. μ΄λ λͺ¨λΈμ΄ μμ μ΄ μ 곡ν λ΅λ³μ μ νμ±μ κ²ν νκ³ , νμν κ²½μ° μμ νλλ‘ μ λν΄μ.
μμ
- ν둬ννΈ: "λ€μ μ§λ¬Έμ λν λ΅λ³μ μ 곡νκ³ , μ€μ€λ‘ νκ°ν΄λ΄: 'μ§κ΅¬μ μμ μ£ΌκΈ°λ μΌλ§μΈκ°μ?'"
- λͺ¨λΈμ μλ΅: "μ§κ΅¬μ μμ μ£ΌκΈ°λ μ½ 24μκ°μ΄μμ. (κ²ν : μ νν΄μ. ν루λ 24μκ°μ΄λκΉ.)"
μ΄ κΈ°λ²μ λͺ¨λΈμ΄ μμ μ μλ΅μ κ²ν νκ³ κ°μ ν¨μΌλ‘μ¨ λ μ νν κ²°κ³Όλ₯Ό λμΆν μ μκ² ν΄μ€μ.
μ΄μ ν둬ννΈ μμ§λμ΄λ§μ κ³ κΈ κΈ°λ²λ€μ μ΄ν΄νμΌλ, μ΄λ₯Ό μ΄λ»κ² νμ©ν μ μμμ§μ λν΄ μκ°ν΄λ³Όκ²μ. μ€μν κ²μ μν©μ λ§κ² κ° κΈ°λ²λ€μ μ μ ν μ‘°ν©ν΄μ μ¬μ©νλ κ±°μμ. μλ₯Ό λ€μ΄, 볡μ‘ν λ¬Έμ λ₯Ό ν΄κ²°ν λλ chain-of-thoughtκ³Ό least-to-most κΈ°λ²μ κ²°ν©νκ³ , λͺ¨λΈμ μλ΅ μΌκ΄μ±μ λμ΄κΈ° μν΄ self-consistency κΈ°λ²μ μΆκ°ν μ μμ΄μ.
κ° κΈ°λ²λ€μ μ μ ν νμ©νλ©΄ AI λͺ¨λΈμ μλ΅μ λμ± μ κ΅νκ² μ‘°μ ν μ μκ² μ£ ? ν둬ννΈ μμ§λμ΄λ§μ μ΄μ μ λ€μν μν©μμ λͺ¨λΈμ μ±λ₯μ μ΅μ νν μ μλ€λ μ μ΄μμ. κ³μν΄μ ν둬ννΈλ₯Ό μ€ννκ³ μ‘°μ νλ©΄μ μμ λ§μ λ Ένμ°λ₯Ό μμκ°μΈμ!