본문 바로가기
Mathematics/확률과 통계

기댓값, 중앙값, 분산, 표준편차, 대칭확률변수-확률과 통계(3)

by 콩돌 2020. 7. 9.
반응형


 기댓값, 중앙값, 분산, 표준편차, 대칭확률변수


본 포스팅에서는 기대값(Expectation), 중앙값(Median), 분산(Variance), 표준편차(Standard Deviation), 대칭확률변수(Symmetric Random Variables)에 대해 다룬다.


 확률 기초 변수


 기대값(Expectation), 평균값(Mean)

기대값은 특정 표본공간 내에서 기대되는 값이며, 확률변수의 평균값이라고도 불린다.

확률질량함수(이산적)와 확률밀도함수(연속적)에서의 기대값 계산은 본질적으로는 같으나 방식이 약간 다르다.

  ○ 확률질량함수에 대해 기대값은 다음과 같이 계산될 수 있다. 

    ▷ 이산적인 데이터를 가지고 계산을 수행하므로 모든 데이터와 확률의 곱을 일일히 더하여야 한다. 


  확률밀도함수 f(x)에 대해 기대값은 다음과 같이 계산될 수 있다.

    ▷ 연속적인 함수를 가지고 계산을 수행하므로 적분을 수행하여야 한다.


 중앙값(중위수, Median)

중앙값은 일반적으로 크기순서대로 나열했을 때 중앙에 있는 값을 의미하며 평균값(기대값)과는 다르다.

  ○ 평균값(기대값)은 값을 평균낸 값을 의미한다.

  ○ 중앙값은 의미 그대로 중앙에 있는 값을 의미한다.

    ▷ 예를들어 집합 {1, 5, 20}이 있다면 평균값은 약 8.67이지만 중앙값은 5이다.

 

확률분포에서의 중앙값누적확률분포의 값을 50% 위치에 두게 만드는 x값이다.



 분산(σ², Variance)

분산평균 값에 대해 확률변수의 분포가 퍼져있는 정도를 나타내는 양의 수로 정의된다.

  ○ 분산값이 크다면 이는 분포가 많이 퍼져있음을 의미한다.

  ○ 다음은 분산을 계산하는 공식을 보여준다.


분산 계산 공식 증명 과정

다음은 분산을 계산하는 공식의 증명 과정을 보여준다.



 표준편차(σ, Standard Deviation)

분산 값에 제곱근을 한 양의 값이며 보통 그리스 문자 σ로 많이 표현한다.




 대칭인 경우의 평균값


 대칭확률변수(Symmetric Random Variables)

만약 확률밀도함수 f(x)가 특정 지점 μ을 기준으로 좌우 대칭이라면 다음과 같다.


이 경우 예상값(평균값) E(x)는 μ이며 다음과 같이 설명될 수 있다.



반응형

댓글