λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
πŸ“– Theory/AI & ML

[AI/ML] λ”₯λŸ¬λ‹μ—μ„œμ˜ ν™•λ₯  뢄포 : 데이터 λͺ¨λΈλ§κ³Ό μ„±λŠ₯ κ°œμ„ μ„ μœ„ν•œ 핡심 κ°œλ…

by 뭅즀 2023. 12. 9.
λ°˜μ‘ν˜•

μ˜€λŠ˜μ€ λ”₯λŸ¬λ‹μ—μ„œ μ€‘μš”ν•œ κ°œλ…μΈ ν™•λ₯  뢄포에 λŒ€ν•΄ μ•Œμ•„λ³΄λ €κ³  ν•΄μš”. ν™•λ₯  λΆ„ν¬λŠ” λ°μ΄ν„°μ˜ νŒ¨ν„΄μ„ μ΄ν•΄ν•˜κ³  λͺ¨λΈμ„ 효과적으둜 ν•™μŠ΅ν•˜λŠ” 데 맀우 μ€‘μš”ν•œ 역할을 ν•΄μš”. 그럼 μ‹œμž‘ν•΄λ³ΌκΉŒμš”?

 

ν™•λ₯  λΆ„ν¬λž€ λ¬΄μ—‡μΈκ°€μš”?

ν™•λ₯  λΆ„ν¬λŠ” μ–΄λ–€ 사건이 λ°œμƒν•  ν™•λ₯ μ„ λ‚˜νƒ€λ‚΄λŠ” ν•¨μˆ˜μž…λ‹ˆλ‹€. 데이터 λΆ„μ„μ—μ„œλŠ” 주어진 데이터가 μ–΄λ–€ 뢄포λ₯Ό λ”°λ₯΄λŠ”지 μ΄ν•΄ν•˜λŠ” 것이 μ€‘μš”ν•΄μš”. 이λ₯Ό 톡해 λ°μ΄ν„°μ˜ νŠΉμ„±μ„ νŒŒμ•…ν•˜κ³ , λͺ¨λΈμ„ ꡬ성할 λ•Œ ν•„μš”ν•œ 정보λ₯Ό 얻을 수 μžˆμ–΄μš”.

 

λ”₯λŸ¬λ‹μ—μ„œμ˜ ν™•λ₯  뢄포 ν™œμš©

λ”₯λŸ¬λ‹μ—μ„œ ν™•λ₯  λΆ„ν¬λŠ” λ‹€μ–‘ν•œ λ°©μ‹μœΌλ‘œ ν™œμš©λ©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄,

  • ν™•λ₯ μ  경사 ν•˜κ°•λ²•(Stochastic Gradient Descent): λͺ¨λΈμ„ ν•™μŠ΅μ‹œν‚¬ λ•Œ μ‚¬μš©λ˜λ©°, 이 λ•Œμ—λŠ” λͺ¨λΈμ˜ νŒŒλΌλ―Έν„°λ“€μ΄ νŠΉμ • ν™•λ₯  뢄포λ₯Ό λ”°λ₯΄κ²Œ λ©λ‹ˆλ‹€.
  • ν™•λ₯ μ  생성 λͺ¨λΈ(Generative Models): 이미지, μŒμ„± 등을 μƒμ„±ν•˜λŠ” λͺ¨λΈμ—μ„œλŠ” λ°μ΄ν„°μ˜ ν™•λ₯  뢄포λ₯Ό ν•™μŠ΅ν•˜μ—¬ μƒˆλ‘œμš΄ 데이터λ₯Ό μƒμ„±ν•©λ‹ˆλ‹€.

 

λŒ€ν‘œμ μΈ ν™•λ₯  뢄포

μ •κ·œ 뢄포 μ˜ˆμ‹œ

  1. μ •κ·œ 뢄포(Normal Distribution): κ°€μž₯ 잘 μ•Œλ €μ§„ ν™•λ₯  λΆ„ν¬λ‘œ, λ°μ΄ν„°μ˜ λŒ€λ‹€μˆ˜κ°€ 평균을 μ€‘μ‹¬μœΌλ‘œ λΆ„ν¬λ˜λŠ” νŠΉμ§•μ΄ μžˆμ–΄μš”.
  2. λ² λ₯΄λˆ„이 뢄포(Bernoulli Distribution): 이진 λ³€μˆ˜(성곡/μ‹€νŒ¨)에 λŒ€ν•œ ν™•λ₯  λΆ„ν¬λ‘œ, 예λ₯Ό λ“€μ–΄ 동전 λ˜μ§€κΈ°λ₯Ό 생각해볼 수 μžˆμ–΄μš”.
  3. λ‹€ν•­ 뢄포(Multinomial Distribution): μ—¬λŸ¬ 개의 λ²”μ£Όλ₯Ό 가진 λ²”μ£Όν˜• λ³€μˆ˜μ— λŒ€ν•œ ν™•λ₯  λΆ„ν¬μž…λ‹ˆλ‹€. μ£Όμ‚¬μœ„λ₯Ό λ˜μ§€λŠ” 경우λ₯Ό 예둜 λ“€ 수 μžˆμ–΄μš”.

 

λͺ¨λΈλ§ν•  λ•ŒλŠ” λ°μ΄ν„°μ˜ νŠΉμ„±μ— λ§žλŠ” μ μ ˆν•œ ν™•λ₯  뢄포λ₯Ό μ„ νƒν•˜λŠ” 것이 μ€‘μš”ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 λͺ¨λΈμ˜ ν•™μŠ΅ μ„±λŠ₯을 높이고, 정확도λ₯Ό κ°œμ„ ν•  수 μžˆμ–΄μš”.


 

μ˜€λŠ˜μ€ λ”₯λŸ¬λ‹μ—μ„œ ν™•λ₯  λΆ„ν¬μ˜ μ€‘μš”μ„±κ³Ό ν™œμš©μ— λŒ€ν•΄ κ°„λž΅νžˆ μ‚΄νŽ΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€.

 

사싀 λ¨Έμ‹ λŸ¬λ‹μ—μ„œ ν™•λ₯  뢄포가 μ–΄λ–»κ²Œ ν™œμš©λ˜λŠ”μ§€ λͺ…ν™•ν•˜κ²Œ μ΄ν•΄ν•˜λ €λ©΄ Likelihood와 MLE(Maximum Likelihood Estimation)에 λŒ€ν•΄ 이해해야 ν•΄μš”. κ°„λ‹¨νžˆ μ„€λͺ…ν•˜λ©΄, νŠΉμ • νŒŒλΌλ―Έν„°κ°€ μ£Όμ–΄μ‘Œμ„ λ•Œ νŠΉμ • 데이터가 λ°œμƒν•  ν™•λ₯ μ„ λ‚˜νƒ€λ‚΄λŠ” Likelihood ν•¨μˆ˜λ₯Ό μ΅œλŒ€ν™”ν•˜λŠ” νŒŒλΌλ―Έν„°λ₯Ό μ°ΎλŠ” 것이 MLE이며, λ”₯λŸ¬λ‹μ—μ„œλŠ” 이 과정을 톡해 λͺ¨λΈ νŒŒλΌλ―Έν„°λ₯Ό μ—…λ°μ΄νŠΈν•˜λ©° μ΅œμ ν™”λ₯Ό μˆ˜ν–‰ν•©λ‹ˆλ‹€.

 

ν™•λ₯  λΆ„ν¬λŠ” λ”₯λŸ¬λ‹μ—μ„œ 데이터 λͺ¨λΈλ§, λΆˆν™•μ‹€μ„± 처리, λͺ¨λΈ 평가 λ“± λ‹€μ–‘ν•œ μΈ‘λ©΄μ—μ„œ μ€‘μš”ν•œ 역할을 ν•˜λŠ”λ°μš”. 이λ₯Ό 톡해 λͺ¨λΈμ˜ μ„±λŠ₯을 κ°œμ„ ν•˜κ³  예츑의 λΆˆν™•μ‹€μ„±μ„ κ³ λ €ν•  수 μžˆμŠ΅λ‹ˆλ‹€. λ”₯λŸ¬λ‹ λͺ¨λΈμ„ κ°œλ°œν•  λ•Œ Likelihood와 MLE의 κ°œλ…μ΄ λ°”λ‘œ ν•„μš”ν•œ 것은 μ•„λ‹ˆμ§€λ§Œ, κ΄€λ ¨ λ…Όλ¬Έμ΄λ‚˜ κ³ κΈ‰ λ¨Έμ‹ λŸ¬λ‹ 기법을 μ΄ν•΄ν•˜κ±°λ‚˜ μƒˆλ‘œμš΄ λͺ¨λΈμ„ κ°œλ°œν•  λ•Œ 도움이 될 κ±°μ—μš”~!

λ°˜μ‘ν˜•