Transformer Attention ์ดํดํ๊ธฐ: Q, K, V์ ์ญํ ๊ณผ ๋์ ์๋ฆฌ
LLMํ๋ฉด transformer๋ฅผ ๋นผ๋จน์ ์ ์๊ณ , ๊ทธ ํต์ฌ ์ค ํ๋๋ ๋ฐ๋ก ์ดํ
์
๋ฉ์ปค๋์ฆ์ธ๋ฐ์, ์ด ๋ฉ์ปค๋์ฆ์ ์ดํดํ๋ฉด ํธ๋์คํฌ๋จธ๊ฐ ์ด๋ป๊ฒ ๋จ์ด๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ตํ๊ณ ๋ฌธ๋งฅ์ ํ์
ํ๋์ง ์ ์ ์์ด์. ํนํ, ํธ๋์คํฌ๋จธ์์ ์ฌ์ฉ๋๋ Query (Q), Key (K), Value (V)๋ ์ดํ
์
์ด ์ด๋ป๊ฒ ์๋ํ๋์ง ์ดํดํ๋ ๋ฐ ์์ฃผ ์ค์ํ ์ญํ ์ ํด์. ์ค๋์ ์ด ์ธ ๊ฐ์ง ์์๊ฐ ์ด๋ป๊ฒ ์๋ก ์์ฉํ๋์ง, ๊ทธ๋ฆฌ๊ณ ํธ๋์คํฌ๋จธ์ ์ธ์ฝ๋์ ๋์ฝ๋์์ ๊ฐ๊ฐ ์ด๋ป๊ฒ ์ฌ์ฉ๋๋์ง์ ๋ํด ์ค๋ช
ํด ๋ณผ๊ฑฐ์์. ๐ Q, K, V ๊ฐ๋
์ดํด๋ณด๊ธฐ Transformer Attention์์์ Query (Q), Key (K), Value (V)๋ ๋จ์ด ๊ฐ์ ์ฐ๊ด์ฑ์ ํ์
ํ๊ณ , ์ค์ํ ์ ๋ณด๋ฅผ ๋ฝ์๋ด๋ ์ญํ ์ ํด์. ๊ฐ ๋จ์ด๋ ๋ฌธ..
2024. 11. 6.