본문 바로가기
Archive/수학 & 통계학 관련

[Prob] 주요 확률분포(이항, 정규, 포아송, 지수)

by 다람이도토리 2021. 4. 28.

이항분포

베르누이 시행

정확하게 2개의 결과만을 가지는 실험으로 보통 성공/실패로 구분된다.
(Ex - 동전던지기, p = 0.5)

이항분포(binomial distribution)

확률변수 X는, n번의 베르누이 시행에서, 각 시행마다 성공률이 p일때, 성공의 횟수가 가지는 분포를 이항분포라고 한다.

 

 

정규분포

연속확률분포에서, 다음과 같은 확률 밀도함수를 가지고 있으면 정규분포라 한다.

여기서, 평균이 0, 표준편차가 1일 경우를 특별히 표준정규분포라고 한다.

정규화

여기서 정규분포를 표준정규분포로 바꿀 수 있는데, 이를 표준화라고 한다.

위의 식을 사용하여, N(μ, σ) -> N(0, 1)로 표준화시킨다.

표준정규분포표는 계산이 되어 있기에, 임의의 정규분포에서 확률을 구하기 위해서는, 표준화가 필수다.

 

 

포아송분포

일정한 시간 단위동안 발생하는 이벤트 수의 확률분포를 포아송 분포라고 한다.

정해진 시간동안, 특정 사건이 일어날 횟수에 대한 기댓값이 λ인 경우, 그 사건이 x회 일어날 확률은 다음과 같다.

이 분포의 평균과 분산은 λ로 주어진다.

Remark>
(1) 포아송 분포의 경우는 n이 크고 p가 대단히 작은 이항분포로 근사할 수 있다.
(2) 포아송 분포의 조건은 np = λ  , 즉 시간당 평균 발생횟수를 일정하게 유지한다는 조건이 핵심이 된다.
포아송 분포의 유도는 다음 내용을 통해 확인할 수 있다. (2)의 조건 하에서 (1)을 적용, 즉 n을 무한대로, p를 0으로 보내는 극한을 고려하여 계산한다.
https://medium.com/@andrew.chamberlain/deriving-the-poisson-distribution-from-the-binomial-distribution-840cc1668239

 

 

지수분포

포아송 분포에서, 어떤 사건이 1회 발생할때까지, 걸리는 시간에 대한 분포를 지수분포라 한다.

이 분포의 평균은 1/λ,  분산은 (1/λ)^2로 계산된다.

 

코드

github.com/SeongwonTak/-KDT-_AI_2_Notes/blob/main/Prob/random_variable_distributions.ipynb

 

SeongwonTak/-KDT-_AI_2_Notes

Contribute to SeongwonTak/-KDT-_AI_2_Notes development by creating an account on GitHub.

github.com

 

'Archive > 수학 & 통계학 관련' 카테고리의 다른 글

[Math] Entropy  (0) 2021.05.01
[Stat] 통계적 추정과 검정(수정)  (4) 2021.04.30
[Stat] 공분산과 상관계수  (0) 2021.04.28
[Prob] 베이즈 정리  (0) 2021.04.28
[Linalg] 최소제곱법과 응용  (0) 2021.04.27