본문 바로가기
Mathematics/확률과 통계

기하분포, 음이항분포, 초기하분포-확률과 통계(8)

by 콩돌 2020. 7. 16.
반응형


 기하분포, 음이항분포, 초기하분포

 

본 포스팅에서는 기하분포(Geometric Distribution), 음이항분포(Negative Binomial Distribution), 초기하분포(Hypergeometric Distribution)에 대해 다루도록한다.

추가적으로 복원추출(with replacement)과 비복원추출(without replacement)이 무엇인지, 그리고 각 분포의 예상치(평균)와 분산의 증명과정에 대해서도 다뤄보도록 한다.



 기하분포(Geometric Distribution)


독립적인 베르누이 시행(Bernoulli Trial)을 여러번 수행할 때 처음 성공까지 시도한 횟수의 분포이다.

  ○ 즉, 베르누이 시행에서 첫 성공까지의 실패 횟수의 분포이다.

  ○ 따라서 한번의 성공을 반드시 포함하는 분포이다.


기하분포의 확률질량함수(PMF)

 

예상치(Expectation)와 분산(Variance)

기하분포의 예상치와 분산은 다음과 같이 계산될 수 있다.



예상치 및 분산의 유도과정



 

※ 무한급수 공식들

  무한급수 공식들이 다음과 같이 존재하므로 예상치 및 분산의 유도 시 참고할 수 있다.

 


 음이항분포(Negative Binomial Distribution)

 

x번의 독립적인 베르누이 시행 중 r번의 성공을 포함하는 이항분포이다.

  ○ 따라서 파라미터로는 rp를 가진다.


음이항분포의 확률질량함수(PMF)


예상치(Expectation)와 분산(Variance)


예상치와 분산의 증명과정



 초기하분포(Hypergeometric Distribution)

 

※ 복원추출(with replacement)과 비복원추출(without replacement)

   초기하분포를 설명하기 전에 복원추출과 비복원추출의 개념을 살짝 다뤄보고자 한다.

     ○ 복원추출은 아이템을 하나 뽑고난 후 다음 아이템을 뽑을 때 뽑은 아이템을 다시 집어넣고 다시 뽑는 행위이다.

       ▷ 즉, 표본을 몇번을 추출하든 총 표본 수와 특정 아이템이 나올 확률은 그대로이다.

     ○ 비복원추출은 아이템을 하나 뽑고난 후 다음 아이템을 뽑을 때 뽑은 아이템을 다시 넣지 않고 뽑는 행위이다.

       ▷ 즉, 표본을 추출할때마다 총 표본 수와 특정 아이템이 나올 확률이 변한다.

 

N개의 물건 중 r개가 성공이 존재하는 경우를 고려한다.

만약 아이템중 하나가 임의로 선택되었을 때, 그 확률은 다음과 같이 표현될 수 있다.


결과적으로 n개의 물건을 복원추출로 뽑았을 때 분포 X는 이항분포로 설명될 수 있으며 다음과 같이 표현된다.

 

하지만 위의 상황에서 비복원 추출로 추출할 경우를 초기하분포라한다.

정리하자면, 초기하분포는 N개의 물건있는 곳에서 r개의 성공(원하는 물건)이 있고,

이를 비복원 추출로 n개를 뽑았을 때 성공(원하는 물건)을 뽑는 경우의 분포를 나타낸다.


초기하분포의 확률질량함수(PMF)


예상치(Expectation)와 분산(Variance)

초기하분포의 예상치와 분산은 다음과 같이 계산될 수 있다.


예상치와 분산의 유도과정

i번째 결과에서 Xi=1이고, 나머지에서 0이라면 확률은 다음과 같다.

X(r,N,n)의 파라미터를 가지는 초기하 확률변수로 두면 다음과 같다.


그리고 예상치는 다음과 같이 계산될 수 있다.


분산은 다음과 같이 계산이 된다.


Xi는 배르누이 확률변수이기 때문에,

또한 i<j 라면,


따라서


이항분포와 초기하분포의 연관성

만약 p=r/N이라 둔다면 다음과 같은 결과를 얻을 수 있다.


N이 무한대로 간다면 다음과 같다.


따라서 p=r/N 이고 N이 무한대로 간다면 초기하분포는 이항분포와 동일해진다.


반응형

댓글