λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
πŸ“– Theory/AI & ML

λ”₯λŸ¬λ‹μ—μ„œμ˜ ν™•λ₯  뢄포 | probability distribution

by 뭅즀 2023. 12. 9.
λ°˜μ‘ν˜•

 

μ •κ·œ 뢄포 μ˜ˆμ‹œ

 

 


ν™•λ₯  λΆ„ν¬λŠ” μ–΄λ–€ 사건이 일어날 κ°€λŠ₯성을 λ‚˜νƒ€λ‚΄λŠ” μˆ˜ν•™μ  λͺ¨λΈλ‘œ, ν™•λ₯  λ³€μˆ˜λΌκ³  λΆˆλ¦¬λŠ” λ³€μˆ˜μ— λŒ€ν•œ κ°€λŠ₯ν•œ κ°’λ“€κ³Ό κ·Έ 값듀이 λ‚˜νƒ€λ‚  ν™•λ₯ μ„ μ •μ˜ν•œλ‹€. μ΄λŸ¬ν•œ λΆ„ν¬λŠ” 이산적인 κ²½μš°μ™€ 연속적인 경우둜 λ‚˜λˆŒ 수 μžˆλ‹€. 예λ₯Ό λ“€μ–΄, μ£Όμ‚¬μœ„λ₯Ό λ˜μ‘Œμ„ λ•Œ λ‚˜μ˜€λŠ” λˆˆμ— λŒ€ν•œ ν™•λ₯ λ³€μˆ˜κ°€ μžˆμ„ λ•Œ, κ·Έ λ³€μˆ˜μ˜ ν™•λ₯ λΆ„ν¬λŠ” μ΄μ‚°κ· λ“±λΆ„포가 λœλ‹€.

 

이산 ν™•λ₯  뢄포(Discrete Probability Distribution)

  • ν™•λ₯  λ³€μˆ˜κ°€ 이산적인 값을 κ°€μ§ˆ λ•Œ μ‚¬μš© 됨
  • ν™•λ₯  μ§ˆλŸ‰ ν•¨μˆ˜(Probability Mass Function, PMF): 각 값에 λŒ€ν•œ ν™•λ₯ μ„ λ‚˜νƒ€λ‚΄λŠ” ν•¨μˆ˜
  • μ˜ˆμ‹œ
    • 이항 뢄포, 포아솑 뢄포 λ“±
    • μ£Όμ‚¬μœ„μ˜ 눈금, 동전을 λ˜μ‘Œμ„ λ•Œμ˜ μ•žλ©΄, λ’·λ©΄, 둜또의 당첨 번호 λ“±

 

 

연속 ν™•λ₯  뢄포(Continuous Probability Distribution)

  • ν™•λ₯  λ³€μˆ˜κ°€ 연속적인 값을 κ°€μ§ˆ λ•Œ μ‚¬μš© 됨
  • ν™•λ₯  밀도 ν•¨μˆ˜(Probability Density Function, PDF): ν™•λ₯  λ³€μˆ˜μ˜ νŠΉμ • 값에 λŒ€ν•œ ν™•λ₯ μ€ ꡬ간에 λŒ€ν•œ μ λΆ„μœΌλ‘œ λ‚˜νƒ€λ‚΄λŠ” ν•¨μˆ˜
  • μ˜ˆμ‹œ
    • μ •κ·œ 뢄포, κ· λ“± 뢄포 λ“±
    • μ‚¬λžŒμ˜ ν‚€, λͺΈλ¬΄κ²Œ, μ˜¨λ„ λ“±

 

 

λ”₯λŸ¬λ‹μ—μ„œμ˜ ν™•λ₯  뢄포 ν™œμš©

  • 데이터 λͺ¨λΈλ§ : ν™•λ₯  뢄포λ₯Ό μ‚¬μš©ν•˜μ—¬ λ°μ΄ν„°μ˜ νŠΉμ„±μ„ λͺ¨λΈλ§ν•  수 μžˆλ‹€. 예λ₯Ό λ“€μ–΄, μ΄λ―Έμ§€μ˜ ν”½μ…€ κ°’ 뢄포λ₯Ό μ•Œκ³  μžˆλ‹€λ©΄, μƒˆλ‘œμš΄ μ΄λ―Έμ§€μ˜ μƒμ„±μ΄λ‚˜ 이상 감지에 ν™œμš©ν•  수 μžˆλ‹€.
  • 손싀 ν•¨μˆ˜ μ •μ˜ : ν•™μŠ΅ 쀑에 λͺ¨λΈμ΄ μ–Όλ§ˆλ‚˜ 쒋은지 μΈ‘μ •ν•˜κΈ° μœ„ν•΄ μ‚¬μš©λ˜λŠ” 손싀 ν•¨μˆ˜μ˜ μ •μ˜μ—λ„ ν™•λ₯  뢄포가 μ‚¬μš©λœλ‹€. μ‹€μ œ κ°’κ³Ό λͺ¨λΈμ˜ 예츑 κ°„μ˜ 차이λ₯Ό κ³„μ‚°ν•˜λŠ” 데 μ‚¬μš©λœλ‹€.
  • λ² μ΄μ§€μ•ˆ λ”₯λŸ¬λ‹ : λ² μ΄μ§€μ•ˆ λ”₯λŸ¬λ‹μ€ ν™•λ₯  뢄포λ₯Ό μ΄μš©ν•˜μ—¬ λͺ¨λΈμ˜ κ°€μ€‘μΉ˜μ™€ λ§€κ°œλ³€μˆ˜μ— λŒ€ν•œ λΆˆν™•μ‹€μ„±μ„ λ‹€λ£¨λŠ” 방법이닀. 이λ₯Ό 톡해 데이터가 λΆ€μ‘±ν•œ μƒν™©μ—μ„œλ„ 더 μ•ˆμ •μ μΈ λͺ¨λΈμ„ ꡬ좕할 수 μžˆλ‹€.

 

사싀 λ¨Έμ‹ λŸ¬λ‹μ—μ„œ ν™•λ₯ λΆ„포가 μ–΄λ–»κ²Œ ν™œμš©λ˜λŠ”μ§€ λͺ…ν™•ν•˜κ²Œ μ΄ν•΄ν•˜λ €λ©΄ Likelihood와 MLE(Maximum Likelihood Estimation)에 λŒ€ν•΄ 이해해야 ν•œλ‹€. κ°„λ‹¨νžˆ μ„€λͺ…ν•˜λ©΄ νŠΉμ • νŒŒλΌλ―Έν„°κ°€ μ£Όμ–΄μ‘Œμ„ λ•Œ νŠΉμ • 데이터가 λ°œμƒν•  ν™•λ₯  즉, Likelihood ν•¨μˆ˜λ₯Ό μ΅œλŒ€ν™”ν•˜λŠ” νŒŒλΌλ―Έν„°λ₯Ό μ°ΎλŠ” 것이 MLE이며 λ”₯λŸ¬λ‹μ—μ„œ λͺ¨λΈ νŒŒλΌλ―Έν„°λ₯Ό μ—…λ°μ΄νŠΈ ν•΄κ°€λ©° μ΅œμ ν™”ν•˜λŠ” 것을 λœ»ν•œλ‹€.

 

ν™•λ₯  λΆ„ν¬λŠ” λ”₯λŸ¬λ‹μ—μ„œ 데이터 λͺ¨λΈλ§, λΆˆν™•μ‹€μ„± 처리, λͺ¨λΈ 평가 λ“± λ‹€μ–‘ν•œ μΈ‘λ©΄μ—μ„œ μ€‘μš”ν•œ 역할을 ν•œλ‹€. 이λ₯Ό 톡해 λͺ¨λΈμ˜ μ„±λŠ₯을 κ°œμ„ ν•˜κ³  예츑의 λΆˆν™•μ‹€μ„±μ„ κ³ λ €ν•  수 μžˆλ‹€. 사싀 λ”₯λŸ¬λ‹ λͺ¨λΈμ„ κ°œλ°œν•˜κΈ° μœ„ν•΄μ„œλŠ” ꡳ이 λͺ°λΌλ„ λ˜λŠ” κ°œλ…μ΄λΌλŠ” 생각이 듀기도 ν•˜μ§€λ§Œ, λ”₯λŸ¬λ‹ κ΄€λ ¨ 논문에 ν™•λ₯  톡계 κ°œλ…μ΄ ꡉμž₯히 자주 λ“±μž₯ν•˜κΈ° λ•Œλ¬Έμ— κ°„λ‹¨ν•˜κ²Œ 라도 μ•Œμ•„λ‘λ©΄ 도움이 λœλ‹€.

λ°˜μ‘ν˜•