๋ฐ์ํ
Transformer ๋ชจ๋ธ์ ์ธ์ฝ๋์ ๋์ฝ๋๋ผ๋ ๋ ๊ฐ์ง ํต์ฌ ๋ถ๋ถ์ผ๋ก ๋๋์ด์.
์ค๋์ ์ด ๋ ๋ถ๋ถ์ด ๊ฐ๊ฐ ์ด๋ค ์ญํ ์ ํ๊ณ , ์ด๋ป๊ฒ ๋ค๋ฅด๊ฒ ๋์ํ๋์ง ์น๊ทผํ๊ฒ ์ค๋ช ํด ๋ณผ๊ฒ์!
๐ ์ธ์ฝ๋ (Encoder)
- ์ญํ : ์ธ์ฝ๋๋ ์ ๋ ฅ๋ ๋ฌธ์ฅ์ ์ ๋ณด๋ฅผ ์ ์ฒด์ ์ผ๋ก ์ดํดํ๋ ค๊ณ ํด์. ์๋ฅผ ๋ค์ด, "๋๋ ๋ฐฅ์ ๋จน์๋ค"๋ผ๋ ๋ฌธ์ฅ์ด ์์ผ๋ฉด, ์ธ์ฝ๋๋ ์ด ๋ฌธ์ฅ์ ๋ชจ๋ ๋จ์ด๋ค์ด ์๋ก ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๊ณ , ๋ฌธ์ฅ์ ์ ์ฒด์ ์ธ ์๋ฏธ์ ๋งฅ๋ฝ์ด ๋ฌด์์ธ์ง๋ฅผ ํ์ ํด์.
- ํน์ง: ์ธ์ฝ๋๋ ๋จผ์ ๊ฐ ๋จ์ด๋ฅผ ๋ฒกํฐ๋ก ๋ณํํ ํ, ๊ฐ ๋จ์ด๋ค์ด ์๋ก ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๋์ง ํ์ ํด์. ์ด๋ ๊ฒ ์ฌ๋ฌ ๋ฒ์ ์ฐ์ฐ์ ๊ฑฐ์น๋ฉด, ๋ฌธ์ฅ์ ์๋ฏธ๋ฅผ ๋ ๊น๊ณ ์ ํํ๊ฒ ์ดํดํ ์ ์์ด์.
- ๊ตฌ์กฐ: ์ธ์ฝ๋๋ Self-Attention๊ณผ ํผ๋ํฌ์๋ ๋คํธ์ํฌ๋ฅผ ์ด์ฉํด์. Self-Attention์ ๋ชจ๋ ๋จ์ด๊ฐ ๋ค๋ฅธ ๋จ์ด์ ์ด๋ค ๊ด๊ณ๊ฐ ์๋์ง ๊ณ์ฐํ๋ฉด์ ๋ฌธ์ฅ ์ ์ฒด๋ฅผ ํ ๋ฒ์ ์ฒ๋ฆฌํด์.
๐ ๋์ฝ๋ (Decoder)
- ์ญํ : ๋์ฝ๋๋ ์ถ๋ ฅ ๋ฌธ์ฅ์ ์์ฑํ๋ ์ญํ ์ ํด์. ์
๋ ฅ ๋ฌธ์ฅ์ ์ฒ๋ฆฌํ ํ, ๊ทธ์ ๋ง๋ ์ถ๋ ฅ์ ํ๋์ฉ ์ฐจ๋ก๋๋ก ๋ง๋ค์ด ๊ฐ์ฃ .
- ์๋ฅผ ๋ค์ด, ๋ฒ์ญ์ ํ๋ค๋ฉด, ๋์ฝ๋๋ ๋จผ์ ์ฒซ ๋ฒ์งธ ๋จ์ด๋ฅผ ์์ฑํ๊ณ , ๊ทธ ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ๋ฉด์ ๋ฒ์ญ๋ฌธ์ ์์ฑํด ๋๊ฐ์.
- ์ด๋, ๋์ฝ๋๋ ์ด์ ์ ์์ฑ๋ ๋จ์ด๋ค์ ๊ณ์ ์ฐธ๊ณ ํ์ฌ ๋ฌธ๋งฅ์ ๋ง๋ ๋จ์ด๋ฅผ ์์ธกํด์.
- ํน์ง: ๋์ฝ๋๋ ๋จ์ด๋ฅผ ํ๋์ฉ ์์ธกํ๋ฉด์ ๋ฌธ์ฅ์ ๋ง๋ญ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ด์ ์ ์์ฑ๋ ๋จ์ด๋ค์ ๋ฐํ์ผ๋ก ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ๊ธฐ ๋๋ฌธ์, ๋ฌธ์ฅ์ ํ๋ฆ์ ์์ฐ์ค๋ฝ๊ฒ ์ด์ด ๋๊ฐ ์ ์์ด์. ์ฆ, ๋์ฝ๋๋ ๋ฌธ์ฅ์ ์์ฐจ์ ์ธ ์์ฑ์ ๊ฐ์ ์ด ์์ด์.
- ๊ตฌ์กฐ: ๋์ฝ๋๋ ๋ ๊ฐ์ง Attention ๊ธฐ๋ฒ์ ์ฌ์ฉํด์:
- Self-Attention: ๋์ฝ๋๊ฐ ์ด๋ฏธ ์์ฑ๋ ๋จ์ด๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ ํด์, ๋ฌธ๋งฅ์ ๋ง๋ ๋ค์ ๋จ์ด๋ฅผ ์์ธกํด์. ์๋ฅผ ๋ค์ด, ์์์ ๋์จ ๋จ์ด๋ค์ด ํ์ ๋จ์ด์ ์ด๋ป๊ฒ ์ํฅ์ ๋ฏธ์น ์ง๋ฅผ ๊ณ ๋ คํด์.
- Encoder-Decoder Attention: ๋์ฝ๋๋ ์ธ์ฝ๋์์ ๋์จ ์ ๋ณด์ ๋์ฝ๋์์ ์์ฑํ๋ ค๋ ๋จ์ด ๊ฐ์ ๊ด๊ณ๋ฅผ ํจ๊ป ๊ณ ๋ คํด์. ์ด๋ฅผ ํตํด ์ ๋ ฅ ๋ฌธ์ฅ์์ ์ป์ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก, ๋ ์ ํํ ์ถ๋ ฅ์ ๋ง๋ค ์ ์์ด์.
๐ ํธ๋์คํฌ๋จธ ๋ค์ํ ๊ตฌ์กฐ
ํธ๋์คํฌ๋จธ๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์ธ์ฝ๋-๋์ฝ๋ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง์ง๋ง, ์ธ์ฝ๋๋ง ์กด์ฌํ๋ ๋ชจ๋ธ๊ณผ ๋์ฝ๋๋ง ์กด์ฌํ๋ ๋ชจ๋ธ๋ ์์ด์. ํนํ ์์ฑํ AI๋ก ์ฃผ๋ชฉ๋ฐ๋ GPT์ ๊ฒฝ์ฐ Only ๋์ฝ๋ ๋ชจ๋ธ์ด๋๋๋ค!
Only ์ธ์ฝ๋
BERT (Bidirectional Encoder Representations from Transformers)
- ๊ตฌ๊ธ์ BERT๋ ์ธ์ฝ๋๋ง ์ฌ์ฉํ๋ ๋ชจ๋ธ์ด์์. BERT๋ ๋ฌธ์ฅ์์ ๊ฐ ๋จ์ด๊ฐ ์๋ค ๋จ์ด๋ค๊ณผ์ ๊ด๊ณ๋ฅผ ํ์ตํด์ ๋ฌธ์ฅ์ ๊น๊ฒ ์ดํดํ๋ ๋ฐ ๊ฐ์ ์ ๊ฐ์ง๊ณ ์์ด์. ๊ธฐ์กด์ ๋ชจ๋ธ๋ค์ด ๋ฌธ์ฅ์ ์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ, ๋๋ ์ค๋ฅธ์ชฝ์์ ์ผ์ชฝ์ผ๋ก๋ง ์ฒ๋ฆฌํ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ, BERT๋ ์๋ฐฉํฅ์ผ๋ก ์ ๋ณด๋ฅผ ํ์ตํ๊ธฐ ๋๋ฌธ์ ๋ฌธ๋งฅ์ ๋ ์ ์ดํดํ ์ ์์ด์.
- ์ฅ์ :
- ๋ฌธ์ฅ ์ดํด์ ๊ฐ์ : BERT๋ ๋ฌธ์ฅ์ ์๋ฏธ๋ฅผ ํ๋ถํ๊ฒ ํ์ ํ ์ ์์ด์. ํนํ ๋ฌธ์ฅ ๋ถ๋ฅ, ๊ฐ์ ๋ถ์, ์ง๋ฌธ-์๋ต๊ณผ ๊ฐ์ ๋ฌธ์ฅ ์ดํด ์์ ์์ ๋งค์ฐ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ์.
- ์ฌ์ ํ์ต๋ ๋ชจ๋ธ ํ์ฉ: BERT๋ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ๋ค์ํ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ ์ฝ๊ฒ fine-tuningํด์ ์ฌ์ฉํ ์ ์์ด์. ์ด๋ฅผ ํตํด ๋ง์ ๋ฐ์ดํฐ ์์ด๋ ๋น ๋ฅด๊ฒ ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์์ด์.
- ๋จ์ :
- ์ถ๋ ฅ ์์ฑ์ ํ๊ณ: BERT๋ ์ถ๋ ฅ ์์ฑ์ด ์๋๋ผ ๋ฌธ์ฅ ์ดํด์ ํนํ๋ ๋ชจ๋ธ์ด๊ธฐ ๋๋ฌธ์ ํ ์คํธ ์์ฑ์ด๋ ๋ฒ์ญ ๋ฑ ์์ฐจ์ ์ธ ์ถ๋ ฅ ์์ฑ ์์ ์๋ ์ ํ์ ์ด์์.
- ์๋ ๋ฌธ์ : BERT๋ ์๋ฐฉํฅ ์ฒ๋ฆฌ๋ฅผ ์ํด ๋ง์ ๊ณ์ฐ์ ํ์๋ก ํ๋ฏ๋ก, ์ถ๋ก ์๋๊ฐ ๋๋ฆด ์ ์์ด์.
- ์ ์ฉ ๋ถ์ผ: ๋ฌธ์ฅ ๋ถ๋ฅ, ๊ฐ์ ๋ถ์, ์ง๋ฌธ-์๋ต ๋ฑ ์ดํด ๊ธฐ๋ฐ ์์ ์ ์ ํฉํด์.
์ธ์ฝ๋ - ๋์ฝ๋
T5 (Text-to-Text Transfer Transformer)
- ๊ตฌ๊ธ์ T5๋ ์ธ์ฝ๋-๋์ฝ๋ ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํด์. ์ด ๋ชจ๋ธ์ ์ ๋ ฅ ๋ฌธ์ฅ์ ์ธ์ฝ๋๊ฐ ์ฒ๋ฆฌํ๊ณ , ๊ทธ ์ฒ๋ฆฌ๋ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก ๋์ฝ๋๊ฐ ์ถ๋ ฅ ๋ฌธ์ฅ์ ์์ฑํ๋ ๊ตฌ์กฐ์์. ์๋ฅผ ๋ค์ด, T5๋ ๋ฒ์ญ ์์ ์ ํ ๋ ์ ๋ ฅ ๋ฌธ์ฅ์ ์ดํดํ ํ, ์ด๋ฅผ ๋ฒ์ญ๋ ๋ฌธ์ฅ์ผ๋ก ๋ณํํ๋ ๋ฐฉ์์ ์ฌ์ฉํด์.
- ์ฅ์ :
- ์ ์ถ๋ ฅ ๋ณํ์ ๊ฐ์ : T5๋ ์ ๋ ฅ๊ณผ ์ถ๋ ฅ์ ๋ชจ๋ ์ฒ๋ฆฌํ ์ ์์ด์ ๋ฒ์ญ, ์์ฝ, ์ง๋ฌธ-์๋ต ๋ฑ ๋ค์ํ ํ ์คํธ ๋ณํ ์์ ์ ์ ๋ฆฌํด์. ์ด๋ฅผ ํตํด ๋ค์ํ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ ํ๋์ ๋ชจ๋ธ๋ก ์ฒ๋ฆฌํ ์ ์์ด์.
- ์ ์ฐ์ฑ: T5๋ ๋ชจ๋ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ text-to-text ํ์์ผ๋ก ์ฒ๋ฆฌํ ์ ์์ด์ ๋ชจ๋ธ ํ์ฅ์ฑ์ด ๋ฐ์ด๋์.
- ๋จ์ :
- ๋ณต์ก์ฑ: ์ธ์ฝ๋-๋์ฝ๋ ๊ตฌ์กฐ๋ ์ฐ์ฐ์ด ๋ณต์กํ๊ณ ์์์ ๋ง์ด ์๋ชจํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์์. ํนํ ๊ธด ๋ฌธ์ฅ์ ๋ํ ์ฒ๋ฆฌ์์ ๋ ๋ง์ ๋ฉ๋ชจ๋ฆฌ์ ์๊ฐ์ด ํ์ํ ์ ์์ด์.
- ์๋ ์ ํ: ์ถ๋ ฅ ์์ฑ์ด ์์ฐจ์ ์ผ๋ก ์ด๋ฃจ์ด์ ธ์ผ ํ๋ฏ๋ก ์ฒ๋ฆฌ ์๋๊ฐ ๋๋ฆด ์ ์์ด์.
- ์ ์ฉ ๋ถ์ผ: ๋ฒ์ญ, ์์ฝ, ํ ์คํธ ์์ฑ ๋ฑ ์ ๋ ฅ๊ณผ ์ถ๋ ฅ์ ๋ชจ๋ ๋ค๋ฃจ๋ ์์ ์ ์ ํฉํด์.
Only ๋์ฝ๋
GPT ์๋ฆฌ์ฆ (Generative Pretrained Transformer)
- OpenAI์ GPT๋ ๋์ฝ๋๋ง ์ฌ์ฉํ๋ ๋ชจ๋ธ์ด์์. GPT๋ ๋ฌธ์ฅ์์ ์ด์ ๋จ์ด๋ค์ ๋ฐํ์ผ๋ก ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ๋ ๋ฐฉ์์ผ๋ก ์๋ํด์. ์ด ๋ชจ๋ธ์ ์ฃผ๋ก ์์ฐจ์ ์ธ ํ ์คํธ ์์ฑ์ ๊ฐ์ ์ ๊ฐ์ง๊ณ ์์ด์. GPT๋ ํ ์คํธ ์์ฑ๋ฟ๋ง ์๋๋ผ, ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ ํ ๋๋ ์์ฃผ ํจ๊ณผ์ ์ด์์.
- ์ฅ์ :
- ํ ์คํธ ์์ฑ์ ํนํ: GPT๋ ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ๋ ๋ฐฉ์์ผ๋ก ์๋ํ๋ฏ๋ก, ์์ฐ์ค๋ฌ์ด ํ ์คํธ ์์ฑ์ ๋งค์ฐ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ์. ํนํ ๋ํํ AI๋ ์ฐฝ์์ ์ธ ๊ธ์ฐ๊ธฐ์ ๊ฐ์ ์์ ์์ ๊ฐ์ ์ ๋ฐํํด์.
- ํจ์จ์ ์ธ ํ๋ จ: ๋์ฝ๋๋ง ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์, ํ๋ จ ๊ณผ์ ์์ ์๋์ ์ผ๋ก ๊ฐ๋จํ๊ณ ๋น ๋ฅด๊ฒ ์๋ ดํ ์ ์์ด์.
- ๋จ์ :
- ๋ฌธ์ฅ ์ดํด์ ํ๊ณ: GPT๋ ์ถ๋ ฅ ์์ฑ์ ์ต์ ํ๋์ด ์์ด์, ๋ฌธ์ฅ์ ์ ํํ ์ดํด์๋ ๋ค์ ํ๊ณ๊ฐ ์์ ์ ์์ด์. ๋ฌธ๋งฅ์ด ๋ณต์กํ ๊ฒฝ์ฐ์๋ ์์ธก์ ์ ํ๋๊ฐ ๋จ์ด์ง ์ ์์ด์.
- ํ๋ จ ๋ฐ์ดํฐ ์์กด์ฑ: GPT ๋ชจ๋ธ์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์กดํ๊ธฐ ๋๋ฌธ์ ํ๋ จ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ๋ฉด ์ฑ๋ฅ์ด ์ ํ๋ ์ ์์ด์.
- ์ ์ฉ ๋ถ์ผ: ํ ์คํธ ์์ฑ, ๋ํํ ๋ชจ๋ธ, ์ฐฝ์์ ๊ธ์ฐ๊ธฐ ๋ฑ ์์ฐจ์ ์ธ ํ ์คํธ ์์ฑ์ด ํ์ํ ์์ ์ ์ ํฉํด์.
๐ ์ธ์ฝ๋์ ๋์ฝ๋์ ์๋ ์ฐจ์ด
- ์ธ์ฝ๋๋ ๋ณ๋ ฌ ์ฐ์ฐ์ด ๊ฐ๋ฅํด์ ์๋๊ฐ ๋น ๋ฅด๊ณ ํจ์จ์ ์ด์์. ํ ๋ฒ์ ๋ชจ๋ ๋จ์ด๋ฅผ ์ฒ๋ฆฌํ ์ ์์ฃ .
- ๋ฐ๋ฉด, ๋์ฝ๋๋ ๋จ์ด๋ฅผ ํ๋์ฉ ์์ฐจ์ ์ผ๋ก ์์ธกํ๊ธฐ ๋๋ฌธ์ ์๋๊ฐ ์๋์ ์ผ๋ก ๋๋ฆด ์ ์์ด์.
๋ฐ์ํ