기하분포, 음이항분포, 초기하분포 |
본 포스팅에서는 기하분포(Geometric Distribution), 음이항분포(Negative Binomial Distribution), 초기하분포(Hypergeometric Distribution)에 대해 다루도록한다.
추가적으로 복원추출(with replacement)과 비복원추출(without replacement)이 무엇인지, 그리고 각 분포의 예상치(평균)와 분산의 증명과정에 대해서도 다뤄보도록 한다.
기하분포(Geometric Distribution) |
독립적인 베르누이 시행(Bernoulli Trial)을 여러번 수행할 때 처음 성공까지 시도한 횟수의 분포이다.
○ 즉, 베르누이 시행에서 첫 성공까지의 실패 횟수의 분포이다.
○ 따라서 한번의 성공을 반드시 포함하는 분포이다.
기하분포의 확률질량함수(PMF)
예상치(Expectation)와 분산(Variance)
기하분포의 예상치와 분산은 다음과 같이 계산될 수 있다.
예상치 및 분산의 유도과정
※ 무한급수 공식들
무한급수 공식들이 다음과 같이 존재하므로 예상치 및 분산의 유도 시 참고할 수 있다.
음이항분포(Negative Binomial Distribution) |
x번의 독립적인 베르누이 시행 중 r번의 성공을 포함하는 이항분포이다.
○ 따라서 파라미터로는 r과 p를 가진다.
음이항분포의 확률질량함수(PMF)
예상치(Expectation)와 분산(Variance)
예상치와 분산의 증명과정
초기하분포(Hypergeometric Distribution) |
※ 복원추출(with replacement)과 비복원추출(without replacement)
초기하분포를 설명하기 전에 복원추출과 비복원추출의 개념을 살짝 다뤄보고자 한다.
○ 복원추출은 아이템을 하나 뽑고난 후 다음 아이템을 뽑을 때 뽑은 아이템을 다시 집어넣고 다시 뽑는 행위이다.
▷ 즉, 표본을 몇번을 추출하든 총 표본 수와 특정 아이템이 나올 확률은 그대로이다.
○ 비복원추출은 아이템을 하나 뽑고난 후 다음 아이템을 뽑을 때 뽑은 아이템을 다시 넣지 않고 뽑는 행위이다.
▷ 즉, 표본을 추출할때마다 총 표본 수와 특정 아이템이 나올 확률이 변한다.
N개의 물건 중 r개가 성공이 존재하는 경우를 고려한다.
만약 아이템중 하나가 임의로 선택되었을 때, 그 확률은 다음과 같이 표현될 수 있다.
결과적으로 n개의 물건을 복원추출로 뽑았을 때 분포 X는 이항분포로 설명될 수 있으며 다음과 같이 표현된다.
하지만 위의 상황에서 비복원 추출로 추출할 경우를 초기하분포라한다.
정리하자면, 초기하분포는 N개의 물건있는 곳에서 r개의 성공(원하는 물건)이 있고,
이를 비복원 추출로 n개를 뽑았을 때 성공(원하는 물건)을 뽑는 경우의 분포를 나타낸다.
초기하분포의 확률질량함수(PMF)
예상치(Expectation)와 분산(Variance)
초기하분포의 예상치와 분산은 다음과 같이 계산될 수 있다.
예상치와 분산의 유도과정
i번째 결과에서 Xi=1이고, 나머지에서 0이라면 확률은 다음과 같다.
X를 (r,N,n)의 파라미터를 가지는 초기하 확률변수로 두면 다음과 같다.
그리고 예상치는 다음과 같이 계산될 수 있다.
분산은 다음과 같이 계산이 된다.
Xi는 배르누이 확률변수이기 때문에,
또한 i<j 라면,
따라서
이항분포와 초기하분포의 연관성
N이 무한대로 간다면 다음과 같다.
따라서 p=r/N 이고 N이 무한대로 간다면 초기하분포는 이항분포와 동일해진다.
'Mathematics > 확률과 통계' 카테고리의 다른 글
연속균등분포와 지수분포-확률과 통계(10) (0) | 2020.07.19 |
---|---|
푸아송분포, 다항분포-확률과 통계(9) (0) | 2020.07.16 |
베르누이 시행과 이항분포-확률과 통계(7) (0) | 2020.07.14 |
확률변수의 선형함수와 선형조합-확률과 통계(6) (0) | 2020.07.13 |
결합확률, 공분산, 상관계수-확률과 통계(5) (0) | 2020.07.12 |
댓글