μ€λμ λ₯λ¬λμμ μ€μν κ°λ μΈ νλ₯ λΆν¬μ λν΄ μμλ³΄λ €κ³ ν΄μ. νλ₯ λΆν¬λ λ°μ΄ν°μ ν¨ν΄μ μ΄ν΄νκ³ λͺ¨λΈμ ν¨κ³Όμ μΌλ‘ νμ΅νλ λ° λ§€μ° μ€μν μν μ ν΄μ. κ·ΈλΌ μμν΄λ³ΌκΉμ?
νλ₯ λΆν¬λ 무μμΈκ°μ?
νλ₯ λΆν¬λ μ΄λ€ μ¬κ±΄μ΄ λ°μν νλ₯ μ λνλ΄λ ν¨μμ λλ€. λ°μ΄ν° λΆμμμλ μ£Όμ΄μ§ λ°μ΄ν°κ° μ΄λ€ λΆν¬λ₯Ό λ°λ₯΄λμ§ μ΄ν΄νλ κ²μ΄ μ€μν΄μ. μ΄λ₯Ό ν΅ν΄ λ°μ΄ν°μ νΉμ±μ νμ νκ³ , λͺ¨λΈμ ꡬμ±ν λ νμν μ 보λ₯Ό μ»μ μ μμ΄μ.
λ₯λ¬λμμμ νλ₯ λΆν¬ νμ©
λ₯λ¬λμμ νλ₯ λΆν¬λ λ€μν λ°©μμΌλ‘ νμ©λ©λλ€. μλ₯Ό λ€μ΄,
- νλ₯ μ κ²½μ¬ νκ°λ²(Stochastic Gradient Descent): λͺ¨λΈμ νμ΅μν¬ λ μ¬μ©λλ©°, μ΄ λμλ λͺ¨λΈμ νλΌλ―Έν°λ€μ΄ νΉμ νλ₯ λΆν¬λ₯Ό λ°λ₯΄κ² λ©λλ€.
- νλ₯ μ μμ± λͺ¨λΈ(Generative Models): μ΄λ―Έμ§, μμ± λ±μ μμ±νλ λͺ¨λΈμμλ λ°μ΄ν°μ νλ₯ λΆν¬λ₯Ό νμ΅νμ¬ μλ‘μ΄ λ°μ΄ν°λ₯Ό μμ±ν©λλ€.
λνμ μΈ νλ₯ λΆν¬
- μ κ· λΆν¬(Normal Distribution): κ°μ₯ μ μλ €μ§ νλ₯ λΆν¬λ‘, λ°μ΄ν°μ λλ€μκ° νκ· μ μ€μ¬μΌλ‘ λΆν¬λλ νΉμ§μ΄ μμ΄μ.
- λ² λ₯΄λμ΄ λΆν¬(Bernoulli Distribution): μ΄μ§ λ³μ(μ±κ³΅/μ€ν¨)μ λν νλ₯ λΆν¬λ‘, μλ₯Ό λ€μ΄ λμ λμ§κΈ°λ₯Ό μκ°ν΄λ³Ό μ μμ΄μ.
- λ€ν λΆν¬(Multinomial Distribution): μ¬λ¬ κ°μ λ²μ£Όλ₯Ό κ°μ§ λ²μ£Όν λ³μμ λν νλ₯ λΆν¬μ λλ€. μ£Όμ¬μλ₯Ό λμ§λ κ²½μ°λ₯Ό μλ‘ λ€ μ μμ΄μ.
λͺ¨λΈλ§ν λλ λ°μ΄ν°μ νΉμ±μ λ§λ μ μ ν νλ₯ λΆν¬λ₯Ό μ ννλ κ²μ΄ μ€μν©λλ€. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ νμ΅ μ±λ₯μ λμ΄κ³ , μ νλλ₯Ό κ°μ ν μ μμ΄μ.
μ€λμ λ₯λ¬λμμ νλ₯ λΆν¬μ μ€μμ±κ³Ό νμ©μ λν΄ κ°λ΅ν μ΄ν΄λ³΄μμ΅λλ€.
μ¬μ€ λ¨Έμ λ¬λμμ νλ₯ λΆν¬κ° μ΄λ»κ² νμ©λλμ§ λͺ ννκ² μ΄ν΄νλ €λ©΄ Likelihoodμ MLE(Maximum Likelihood Estimation)μ λν΄ μ΄ν΄ν΄μΌ ν΄μ. κ°λ¨ν μ€λͺ νλ©΄, νΉμ νλΌλ―Έν°κ° μ£Όμ΄μ‘μ λ νΉμ λ°μ΄ν°κ° λ°μν νλ₯ μ λνλ΄λ Likelihood ν¨μλ₯Ό μ΅λννλ νλΌλ―Έν°λ₯Ό μ°Ύλ κ²μ΄ MLEμ΄λ©°, λ₯λ¬λμμλ μ΄ κ³Όμ μ ν΅ν΄ λͺ¨λΈ νλΌλ―Έν°λ₯Ό μ λ°μ΄νΈνλ©° μ΅μ νλ₯Ό μνν©λλ€.
νλ₯ λΆν¬λ λ₯λ¬λμμ λ°μ΄ν° λͺ¨λΈλ§, λΆνμ€μ± μ²λ¦¬, λͺ¨λΈ νκ° λ± λ€μν μΈ‘λ©΄μμ μ€μν μν μ νλλ°μ. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ μ±λ₯μ κ°μ νκ³ μμΈ‘μ λΆνμ€μ±μ κ³ λ €ν μ μμ΅λλ€. λ₯λ¬λ λͺ¨λΈμ κ°λ°ν λ Likelihoodμ MLEμ κ°λ μ΄ λ°λ‘ νμν κ²μ μλμ§λ§, κ΄λ ¨ λ Όλ¬Έμ΄λ κ³ κΈ λ¨Έμ λ¬λ κΈ°λ²μ μ΄ν΄νκ±°λ μλ‘μ΄ λͺ¨λΈμ κ°λ°ν λ λμμ΄ λ κ±°μμ~!