본문 바로가기
Archive/수학 & 통계학 관련

[Stat] Inverse CDF technique

by 다람이도토리 2021. 5. 24.

프로그래머스 Week 6 Day 1 내용 중 정리.

추가참고 자료 : https://m.blog.naver.com/jinis_stat/221648391742

Inverse CDF technique를 적용하는 이유

샘플링 상황을 고려해보자. 연속 확률 분포에서 확률 밀도 함수는 확률변수 정의역내 x가 주어지면 확률값 P(x)를 돌려주게 된다.

그런데, 샘플을 뽑기 위해서 필요한 것은 P(x)가 아닌 x이다. 다시 말해 확률 밀도 함수 하나 만으로는 샘플링이 불가능하다.  따라서, 샘플을 뽑기 위해서는 output이 x가 되는 함수를 정의해야 한다. 대표적인 것은 Inverse CDF를 활용하는 것이다.

 

Inverse CDF의 활용 근거, 샘플링의 조건

모든 확률분포의 누적 분포 함수는 [0, 1] 사이의 균등분포를 따르게 된다. 확률이 달라질 리가 없다.

즉, 위의 상황을 고려하였을 때 만일 난수 생성을 [0, 1] 내에서 균등하게 한다면, 이를 활용하여 확률 변수에 대한 샘플링이 가능해진다.

 

Inverse CDF의 계산 예시

일반적인 경우

확률변수 X의 누적 분포 함수 F(x)의 역함수를 계산할 수 있다면, 확률 변수 X를 다음과 같은 방식으로 샘플링할 수 있다.

즉 역함수를 계산할수만다면, sampling이 가능해진다.

 

실제 계산 예시 

지수분포에 대해서 고려해보려고 한다. 지수분포는 x>0, λ>0 인 경우에 대해 다음과 같이 주어진다.

f(x)를 0에서 x까지 적분하면,

위의 함수의 역함수를 구하면, 

따라서, 표본 추출시

를 사용하게 된다.

'Archive > 수학 & 통계학 관련' 카테고리의 다른 글

[Prob] 우도(가능도) 최대우도 추정법  (0) 2021.05.27
[Stat] 선형회귀분석이란?  (0) 2021.05.26
[Stat] 기초 통계량 구현 코드  (0) 2021.05.17
[Stat] 정규성의 검정  (0) 2021.05.10
[Math] Entropy  (0) 2021.05.01