
[NLP] 텍스트 임베딩 모델 설명 | Huggingface sentence-transformers, OpenAI

·
🏛 Research/NLP & LLM
자연어처리(NLP) 분야에서 텍스트 임베딩(Text Embedding)이란, 문장이나 문서를 컴퓨터가 이해할 수 있도록 고차원의 벡터로 변환하는 작업을 말한다. 이 벡터는 단어 간, 문장 간의 의미적 유사성을 수치적으로 표현할 수 있도록 도와준다.텍스트 임베딩은 다음과 같은 작업에서 핵심 역할을 한다.문장 유사도 분석의미 기반 검색 (semantic search)텍스트 분류 및 군집화추천 시스템질문-응답(QA) 매칭정보 검색 (Retrieval-Augmented Generation 등)임베딩 벡터가 잘 만들어졌다는 것은, 예를 들어 "나는 영화를 좋아한다"와 "영화 보는 걸 즐긴다" 같은 문장이 서로 가까운 위치의 벡터로 표현된다는 뜻이다. 이처럼 유사한 의미의 문장이 가까이 위치하면 검색, 분류, 추천..