본문 바로가기
Mathematics/확률과 통계

연속균등분포와 지수분포-확률과 통계(10)

by 콩돌 2020. 7. 19.
반응형


 연속균등분포와 지수분포


본 포스팅에서는 연속균등분포(Continuous Uniform Distribution), 지수분포(Exponential Distribution)에 대해 다루도록 한다.

더 상세하기는 각 분포의 예상치(평균), 분산의 증명과 지수분포에서 무기억성(Memoryless)의 특징에 대해 다뤄보도록한다.


 연속균등분포(Continuous Uniform Distribution)


균등분포는 말 그대로 입력변수 x 값에 따라 균등한 확률을 가지는 분포를 의미하며 가장 단순한 확률분포 중 하나이다.

X~U(a, b)로 표현할 수 있으며, a와 b사이의 값을 가지며, U(0,1)인 경우는 표준연속균등분포라 칭한다.

확률밀도함수와 누적분포함수는 다음과 같이 표현 가능하다.


확률밀도함수(PDF)


누적분포함수(CDF)


아래 그림은 균등분포의 확률밀도함수와 누적분포함수의 그래프를 보여준다.


균등분포에서 특정 범위(예를들어 c에서 d)의 확률값은 다음과 같이 계산될 수 있다. 

  ○ 아래 계산식은 누적분포함수에서 쉽게 유도 가능하다.

 


예상값(Expectation)과 분산(Variance)

균등분포함수에서 예상값과 분산은 다음과 같이 간략하게 계산이 가능하다.


예상값과 분산의 유도





 

 지수분포(Exponential Distribution)

 

지수분포는 지수함수를 이용한 확률 분포이다.

지수분포는 특정 사건이 발생할 때까지의 대기 시간이 얼마나 어느정도인지에 대한 확률을 모사할 때 활용된다.

  ○ 푸아송분포(Poisson Distribution)와 지수분포 간에는 비슷해보이지만 다음과 같은 차이를 보인다.

    ▷ 푸아송분포는 정해진(고정된) 시간안에 사건의 횟수에 대한 확률분포이다.

    ▷ 지수분포는 사건 발생 이후 다음 사건에 대한 대기 시간(시간 간격)에 대한 확률분포이다.

  ○ 만약 일정시간 동안 발생하는 사건의 수가 푸아송분포일 경우에 사건간의 대기시간의 분포는 지수분포를 따른다. 


다음은 지수분포가 사용되는 대표적인 예이다.

  ○ 지진이 발생할 때까지의 시간

  ○ 새로운 전쟁이 발생할 때까지의 시간

  ○ 사람이 받는 전화 중 잘못된 번호로 판명되기까지의 시간


확률밀도함수(PDF)


누적분포함수(CDF)


다음 그림은 지수분포의 확률밀도 함수와 누적분포함수를 보여준다.



예상값(Expectation)과 분산(Variance)

예상치와 분산은 다음과 같이 계산될 수 있다.

  ○ 예상치는 단위 시간당 사건이 λ회 발생할 시 평균적으로 1/λ시간 만큼 대기해야한다는 것을 나타낸다.  


예상값과 분산의 유도





 지수분포의 무기억성(memoryless) 특성

지수분포와 무기억성

지수분포는 x와 y가 0보다 큰 양수일 경우 다음과 같은 특징을 가진다.

  ○ 아래 식은 사건 x가 발생한 이후 사건 y가 뒤따라 발생할 확률을 표현한다. (조건부확률)

  ○ 하지만 위의 조건부 확률이 지수분포의 경우 단순히 사건 x의 발생여부와 상관없이 사건 y가 발생할 확률과 같다.

위의 식을 그림으로 표현할 경우 다음과 같다.

이는 무기억성(memoryless)이라는 독특한 특성이며 지수분포는 이러한 특성을 가진 유일한 연속 분포이다.


무기억성의 특성

위에서 설명한 무기억성과 관련된 특성은 다음과 같다.


위의 특성은 아래와 동등하다 볼 수 있다.


확률변수 X가 지수확률변수라면,


따라서 는 다음과 같이 표현할 수 있다.


무기억성 특성의 확장

만약 X1,...,Xn이 서로 독립적인 지수확률변수의 순서열이며, 각각 파라미터 λ1,...,λn을 가진다 가정하자.

이때에는, min(X1,...,Xn)는 다음과 같은 지수함수 파라미터를 가진다.


위의 내용 증명



반응형

댓글