์ค๋์ ๋ฅ๋ฌ๋์์ ํต์ฌ์ ์ธ ๊ฐ๋ ์ธ Back Propagation (์ค์ฐจ ์ญ์ ํ) ์ ๋ํด ๊น์ด ์๋ ์ค๋ช ์ ํด๋ณด๋ ค๊ณ ํด์. ์ด ๊ฐ๋ ์ ์ดํดํ๋ ๊ฒ์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๊ตฌ์ถํ๊ณ ์ต์ ํํ๋ ๋ฐ ๋งค์ฐ ์ค์ํ ์์์ ๋๋ค.
Back Propagation์ด๋?

Back Propagation์ ๋ฅ๋ฌ๋์์ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ํ์ต์ํฌ ๋ ์ฌ์ฉ๋๋ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ๋ชจ๋ธ์ ์ถ๋ ฅ ๊ฐ๊ณผ ์ค์ ๊ฐ ์ฌ์ด์ ์ค์ฐจ๋ฅผ ์ญ๋ฐฉํฅ์ผ๋ก ์ ํํ์ฌ ๊ฐ ํ๋ผ๋ฏธํฐ๊ฐ ์ค์ฐจ์ ์ผ๋ง๋ ๊ธฐ์ฌํ๋์ง ๊ณ์ฐํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ฐ์ดํธํฉ๋๋ค.
๋์ ์๋ฆฌ
1. ์์ ํ (Forward Propagation) : ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ ๊ฒฝ๋ง์ ์ ๋ ฅํ๊ณ , ๊ฐ ๋ ์ด์ด์์ ๊ฐ์ค์น์ ํ์ฑํ ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ์ถ๋ ฅ์ ๊ณ์ฐํ๋ ๊ณผ์ ์ ๋๋ค.
2. ์ค์ฐจ ๊ณ์ฐ (Error Calculation) : ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ ์ฌ์ด์ ์ค์ฐจ๋ฅผ ๊ณ์ฐํฉ๋๋ค. ์ด ์ค์ฐจ๋ ์ผ๋ฐ์ ์ผ๋ก ์์ค ํจ์๋ฅผ ํตํด ์ ์๋๋ฉฐ, ์๋ฅผ ๋ค์ด ํ๊ท ์ ๊ณฑ ์ค์ฐจ(Mean Squared Error)๋ ํฌ๋ก์ค ์ํธ๋กํผ ์์ค(Cross-Entropy Loss) ๋ฑ์ด ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
3. ์ญ์ ํ (Backward Propagation) : ์ค์ฐจ๋ฅผ ์ญ๋ฐฉํฅ์ผ๋ก ์ ํํ์ฌ ๊ฐ ๋ ์ด์ด์ ๊ฐ์ค์น์ ํธํฅ์ ๋ํ ๊ทธ๋๋์ธํธ(Gradient)๋ฅผ ๊ณ์ฐํฉ๋๋ค. ์ด ๊ทธ๋๋์ธํธ๋ ์ค์ฐจ๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
4. ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ (Parameter Update) : ๊ณ์ฐ๋ ๊ทธ๋๋์ธํธ๋ฅผ ์ฌ์ฉํ์ฌ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ(์: ๊ฒฝ์ฌ ํ๊ฐ๋ฒ)์ ํตํด ์ ๊ฒฝ๋ง์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ฐ์ดํธํฉ๋๋ค. ์ด ๊ณผ์ ์ ๋ฐ๋ณตํ๋ฉด์ ๋ชจ๋ธ์ด ํ์ต๋์ด ๊ฐ๋ ๊ฒ์ ๋๋ค.
Back Propagation์ ์ค์์ฑ
- ๋ณต์กํ ๋ชจ๋ธ ํ์ต: ์ฌ์ธต ์ ๊ฒฝ๋ง์์๋ ์๋ฐฑ๋ง ๊ฐ์ ํ๋ผ๋ฏธํฐ๊ฐ ์๊ธฐ ๋๋ฌธ์, ๊ฐ ํ๋ผ๋ฏธํฐ์ ๋ํ ๊ทธ๋๋์ธํธ๋ฅผ ํจ์จ์ ์ผ๋ก ๊ณ์ฐํ๋ ๊ฒ์ด ๋งค์ฐ ์ค์ํฉ๋๋ค.
- ์๋ํ๋ ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ: Back Propagation์ ํตํด ์๋์ผ๋ก ๊ฐ ํ๋ผ๋ฏธํฐ๊ฐ ์ค์ฐจ์ ๊ธฐ์ฌํ๋ ์ ๋๋ฅผ ๊ณ์ฐํ ์ ์์ด, ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํจ๊ณผ์ ์ผ๋ก ํ์ต์ํฌ ์ ์์ต๋๋ค.
์ค๋์ Back Propagation์ ๊ฐ๋ ๊ณผ ์๋ ์๋ฆฌ์ ๋ํด ์์ธํ ์์๋ณด์์ต๋๋ค. ์ด ๊ฐ๋ ์ ํตํด ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ์ด๋ป๊ฒ ํ์ต๋๋์ง ์ดํดํ๋ ๊ฒ์ ๋งค์ฐ ์ค์ํฉ๋๋ค.