기댓값, 중앙값, 분산, 표준편차, 대칭확률변수 |
본 포스팅에서는 기대값(Expectation), 중앙값(Median), 분산(Variance), 표준편차(Standard Deviation), 대칭확률변수(Symmetric Random Variables)에 대해 다룬다.
확률 기초 변수 |
기대값(Expectation), 평균값(Mean) |
기대값은 특정 표본공간 내에서 기대되는 값이며, 확률변수의 평균값이라고도 불린다.
확률질량함수(이산적)와 확률밀도함수(연속적)에서의 기대값 계산은 본질적으로는 같으나 방식이 약간 다르다.
○ 확률질량함수에 대해 기대값은 다음과 같이 계산될 수 있다.
▷ 이산적인 데이터를 가지고 계산을 수행하므로 모든 데이터와 확률의 곱을 일일히 더하여야 한다.
○ 확률밀도함수 f(x)에 대해 기대값은 다음과 같이 계산될 수 있다.
▷ 연속적인 함수를 가지고 계산을 수행하므로 적분을 수행하여야 한다.
중앙값(중위수, Median) |
중앙값은 일반적으로 크기순서대로 나열했을 때 중앙에 있는 값을 의미하며 평균값(기대값)과는 다르다.
○ 평균값(기대값)은 값을 평균낸 값을 의미한다.
○ 중앙값은 의미 그대로 중앙에 있는 값을 의미한다.
▷ 예를들어 집합 {1, 5, 20}이 있다면 평균값은 약 8.67이지만 중앙값은 5이다.
확률분포에서의 중앙값은 누적확률분포의 값을 50% 위치에 두게 만드는 x값이다.
분산(σ², Variance) |
분산은 평균 값에 대해 확률변수의 분포가 퍼져있는 정도를 나타내는 양의 수로 정의된다.
○ 분산값이 크다면 이는 분포가 많이 퍼져있음을 의미한다.
○ 다음은 분산을 계산하는 공식을 보여준다.
분산 계산 공식 증명 과정
다음은 분산을 계산하는 공식의 증명 과정을 보여준다.
표준편차(σ, Standard Deviation) |
분산 값에 제곱근을 한 양의 값이며 보통 그리스 문자 σ로 많이 표현한다.
대칭인 경우의 평균값 |
대칭확률변수(Symmetric Random Variables) |
만약 확률밀도함수 f(x)가 특정 지점 μ을 기준으로 좌우 대칭이라면 다음과 같다.
이 경우 예상값(평균값) E(x)는 μ이며 다음과 같이 설명될 수 있다.
'Mathematics > 확률과 통계' 카테고리의 다른 글
결합확률, 공분산, 상관계수-확률과 통계(5) (0) | 2020.07.12 |
---|---|
체비쇼프 부등식과 분위수-확률과 통계(4) (0) | 2020.07.11 |
조건부확률, 사후확률, 베이즈정리-확률과 통계(2) (0) | 2020.07.08 |
사건의 여집합, 교집합, 합집합-확률과 통계(1) (0) | 2020.07.06 |
확률통계 기초용어-확률과 통계(0) (0) | 2020.07.05 |
댓글