[프롬프트 엔지니어링] (1) 기본 기법과 예시 | Zero-shot One/Few-shot learning

오늘은 프롬프트 엔니지어링의 기본적인 기법의 개념과 여러 접근 방식에 대해 설명할 예정입니다. 이 글을 통해 프롬프트 엔지니어링에 대해 한 걸음 더 나아갈 수 있기를 바랍니다 ~!

사실 오늘 살펴보는 기법들은 굉장히 기본적인 것들로 프롬프트 엔지니링을 조금 더 쉽게 이해할 수 있도록 도와주는 정도의 내용이에요. 조금 더 고급 기법도 다음 포스팅에서 소개하고 있으니 많은 관심 부탁드려요!

프롬프트 엔지니어링이란?

프롬프트 엔지니어링은 인공지능 모델, 특히 언어 모델이 주어진 작업을 더 잘 수행하도록 입력(프롬프트)을 설계하고 조정하는 과정입니다. 이는 모델에게 정확한 맥락과 지침을 제공하여 원하는 결과를 얻기 위한 중요한 기술입니다. 프롬프트 엔지니어링의 주요 기법으로는 zero-shot, one-shot, few-shot learning, 그리고 chain of thought가 있습니다. 이제 각각의 기법을 자세히 살펴보겠습니다.

Zero-shot Learning

Zero-shot learning은 모델이 특정 작업에 대해 훈련되지 않았음에도 불구하고 적절한 프롬프트를 통해 그 작업을 수행하도록 하는 방법으로, 모델의 일반화 능력을 활용하는 기법이에요.

프롬프트: "이 문장이 긍정적인지 부정적인지 분석해줘: '나는 오늘 매우 행복해.'"
모델의 응답: "긍정적입니다."
이 예시에서 모델은 '긍정적' 혹은 '부정적'이라는 단어의 의미를 이해하고, 새로운 문장에 적용하여 결과를 도출

One-shot Learning

One-shot learning은 모델에게 특정 작업의 예시를 하나 제공하여, 모델이 그 예시를 바탕으로 유사한 작업을 수행하게 하는 방법입니다.

프롬프트: "다음 문장을 영어로 번역해줘. 예시: '안녕하세요' -> 'Hello' '저는 학생입니다' ->"
모델의 응답: "'I am a student.'"
이 경우 모델은 한 개의 예시를 보고 새로운 문장에 대해 유사한 번역 작업을 수행

Few-shot Learning

Few-shot learning은 모델에게 여러 개의 예시를 제공하여, 모델이 이 예시들을 바탕으로 작업을 수행하게 하는 방법입니다. 이는 모델에게 더 많은 맥락을 제공하여 성능을 향상시키는 데 유용합니다.

프롬프트: "다음 문장을 영어로 번역해줘. 예시:'안녕하세요' -> 'Hello', '저는 학생입니다' -> 'I am a student', '오늘 날씨가 좋네요' -> 'The weather is nice today', '커피 한 잔 주세요' ->"
모델의 응답: "'Please give me a cup of coffee.'"
이 예시에서는 여러 개의 번역 예시를 제공하여, 모델이 더욱 정확하게 번역을 수행할 수 있게 함

Chain of Thought

Chain of thought 기법은 복잡한 문제를 해결할 때 유용한 접근 방식입니다. 이는 모델이 문제를 단계별로 해결할 수 있도록 프롬프트를 구성하는 방법입니다.

프롬프트: "아래 문제를 단계별로 해결해봐: 문제: '만약 사과가 5개 있고, 3개를 더 산다면 총 몇 개의 사과가 있나요?', 1단계: '현재 사과의 개수를 세어보자.', 2단계: '새로 산 사과의 개수를 더하자.', 3단계: '총 사과의 개수를 계산하자.'"
모델의 응답: "현재 사과는 5개이다. 새로 산 사과는 3개이다. 총 사과의 개수는 5 + 3 = 8개이다."
이 경우 모델은 문제를 단계별로 나누어 생각하고 해결하는 과정을 통해 정확한 답을 도출할 수 있음

프롬프트 엔지니어링은 AI 모델의 성능을 최대한 끌어내기 위한 중요한 기술이에요. 오늘 설명드린 Zero-shot, one-shot, few-shot learning, 그리고 chain of thought 기법은 각각 다른 상황에서 유용하게 사용될 수 있는데요. 이 글을 통해 프롬프트 엔지니어링의 기본 개념과 다양한 접근 방식을 이해하는 데 도움이 되었기를 바랍니다.

'🏛 Research > NLP & LLM' 카테고리의 다른 글

[프롬프트 엔지니어링] (3) 고급 기법: Few-shot, Chain-of-thought, Self-consistency, Selection-inference, Least-to-most, ReAct, Self-evaluation (0)	2024.07.27
[프롬프트 엔지니어링] (2) 프롬프트 설계 핵심 개념 : Role (역할) Policy (정책) Audience (대상) Knowledge (지식) Format (형식) Task (작업) Example (예시) (0)	2024.07.27
LLM 프롬프트 엔니지어링, 그게 대체 뭔데? 나도 알아야해!? (0)	2024.07.26
[NLP] BERT 간단 설명 \| Bi-Directional LM \| 양방향 언어 모델 (0)	2023.09.25
[오픈 소스] BERT를 이용한 한국어 개체명 인식 \| NER (Named Entity Recognition) (0)	2022.12.15

[프롬프트 엔지니어링] (1) 기본 기법과 예시 | Zero-shot One/Few-shot learning | Chain of Thought

프롬프트 엔지니어링이란?

Zero-shot Learning

One-shot Learning

Few-shot Learning

Chain of Thought

'🏛 Research > NLP & LLM' 카테고리의 다른 글

티스토리툴바