본문 바로가기
728x90

LLM8

Transformer Attention 이해하기: Q, K, V의 역할과 동작 원리 LLM하면 transformer를 빼먹을 수 없고, 그 핵심 중 하나는 바로 어텐션 메커니즘인데요, 이 메커니즘을 이해하면 트랜스포머가 어떻게 단어들 간의 관계를 학습하고 문맥을 파악하는지 알 수 있어요. 특히, 트랜스포머에서 사용되는 Query (Q), Key (K), Value (V)는 어텐션이 어떻게 작동하는지 이해하는 데 아주 중요한 역할을 해요. 오늘은 이 세 가지 요소가 어떻게 서로 작용하는지, 그리고 트랜스포머의 인코더와 디코더에서 각각 어떻게 사용되는지에 대해 설명해 볼거예요. 📌 Q, K, V 개념 살펴보기 Transformer Attention에서의 Query (Q), Key (K), Value (V)는 단어 간의 연관성을 파악하고, 중요한 정보를 뽑아내는 역할을 해요. 각 단어는 문.. 2024. 11. 6.
[LLM] OpenAI GPT API 사용 가이드 | ChatGPT 코드로 사용해보기 안녕하세요 ! 요즘 LLM 공부를 하면서 계속 기록을 남기고 있는 뭅즤입니다.오늘은 OpenAI의 GPT API를 사용하는 방법에 대해 알려드릴게요 🔥 OpenAI의 GPT API를 사용하면 OpenAI LLM의 다양한 기능을 사용해 볼 수 있어요. 복잡한 코딩이나 AI 모델 학습 없이도 챗봇, 글쓰기 도우미, 데이터 분석, 그리고 번역 등 다양한 기능을 쉽게 구현할 수 있답니다. 이러한 API 사용법을 알면 다양한 프로젝트에 직접 LLM을 활용할 수 있겠죠? 지금부터 OpenAI GPT API를 사용하기 위해 필요한 것들을 차근차근 알아볼게요.📌 API 사용 준비 OpenAI 유료 결제를 하셨다면, OpenAI Platform에서 로그인 후, API 키를 발급받으셔야 해요!이 API 키는 OpenA.. 2024. 9. 15.
[LLM] Ollama: 로컬에서 LLM을 실행하는 가장 쉬운 방법 | ollama 사용 방법 요즘은 허깅페이스, 랭체인 등의 프레임워크 덕에 LLM을 사용하는 방법이 정말 다양하고 편리해졌어요. 하지만 여전히 클라우드 기반의 복잡한 설정이나 높은 비용 때문에 고민하는 분들도 많죠. 이럴 때 도움이 되는 플랫폼이 바로 Ollama입니다. Ollama는 사용자가 클라우드 없이도 로컬에서 간편하게 대형 언어 모델을 실행할 수 있도록 도와줘요. 그리고 데이터 프라이버시를 지키면서도 뛰어난 성능을 제공하니, AI 기술을 보다 쉽게 접근할 수 있도록 해준답니다. 📌 주요 기능로컬에서 모델 실행 : Ollama는 LLM을 로컬 컴퓨터에서 직접 실행할 수 있게 해줘요. 덕분에 클라우드 서비스를 사용하지 않아도 되고, 데이터가 외부로 나가지 않으니 프라이버시를 지킬 수 있어요.사전 학습된 모델 제공 : Oll.. 2024. 9. 11.
[프롬프트 엔지니어링] (4) 고급 기법 : Expert prompting, Generated knowledge prompting, RAG, Tree-of-Thought, Plan-and-solve prompting, Automatic prompt engineer 이번 포스팅에서는 프롬프트 엔지니어링의 고급 기법들에 대해 알아보려고 해요. 다양한 기술을 통해 AI 모델의 성능을 한층 더 향상시킬 수 있습니다. 특히, Expert Prompting, Generated Knowledge Prompting, RAG, Tree-of-Thought, Plan-and-Solve Prompting, Automatic Prompt Engineering과 같은 기법들을 살펴볼 거예요. 각 기법의 개념과 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다. 그럼 하나씩 살펴볼까요?1. Expert PromptingExpert Prompting은 모델에게 특정 분야의 전문적인 지식을 갖춘 것처럼 행동하도록 유도하는 프롬프트 기법입니다. 이 기법은 모델이 특정 전문가의 역할을 맡아, .. 2024. 7. 27.
[프롬프트 엔지니어링] (3) 고급 기법: Few-shot, Chain-of-thought, Self-consistency, Selection-inference, Least-to-most, ReAct, Self-evaluation 이번 포스팅에서는 프롬프트 엔지니어링의 고급 기법들에 대해 알아보려고 해요. 이 기법들은 AI 모델이 복잡한 작업을 더 효과적으로 수행할 수 있도록 도와주는 중요한 도구들이에요. 특히 few-shot examples, chain-of-thought, self-consistency, selection-inference, least-to-most, react, self-evaluation 같은 기법들을 다룰 거예요. 각각의 기법을 이해하고 적절히 활용하면, 더 정확하고 유용한 AI 응답을 얻을 수 있어요. 그럼, 각 기법들을 하나씩 살펴볼까요?Few-shot ExamplesFew-shot examples는 모델에게 여러 개의 예시를 제공해서, 모델이 이 예시들을 바탕으로 작업을 수행하게 하는 방법이에요. 이.. 2024. 7. 27.
[프롬프트 엔지니어링] (2) 프롬프트 설계 핵심 개념 : Role (역할) Policy (정책) Audience (대상) Knowledge (지식) Format (형식) Task (작업) Example (예시) 오늘은 프롬프트 엔지니어링에서 중요한 프롬프트 설계 핵신 개념들에 대해 알아보려고 해요. 프롬프트를 잘 설계하는 것은 AI 모델이 원하는 방식으로 응답하도록 유도하는 데 핵심적인 역할을 해요. 프롬프트 구성 요소를 이해하면, 더 효과적이고 정확한 프롬프트를 만들 수 있어서 모델의 성능을 최적화하는 데 큰 도움이 돼요. 그럼, 각각의 구성 요소에 대해 자세히 살펴볼까요?프롬프트 설계 핵심 개념프롬프트를 잘 설계하기 위해서는 몇 가지 주요 개념을 이해하고 적절히 사용하는 것이 중요해요. 기본적이고 핵심적인 개념에는 다음과 같은 것들이 있어요Role (역할)Policy (정책)Audience (대상)Knowledge (지식)Format (형식)Task (작업)Example (예시) 1. Role (역할)Rol.. 2024. 7. 27.
728x90