가설검정(유의수준, z-검정) |
본 포스팅에서는 유의수준(Significance level)과 표준정규분포를 이용한 z-검정에 대해서 다룰 것이다.
가설검정의 유의수준(Significance level) |
오류의 종류: 검정을 수행할 때 다음과 같은 오류가 존재한다.
○ 1종오류(type I error): 귀무가설이 참일때 이를 잘못 기각함으로써 발생하는 오류
▷ 1종 오류의 발생 가능성은 α보다 크지 않다.
○ 2종오류(type II error): 귀무가설이 거짓일때 이를 잘못 채택함으로써 발생하는 오류
유의수준(Significance level)은 가설검정에 사용되는 기준값으로써, 1종 오류 확률의 상한으로 정의된다.
○ 신뢰수준이 1-α라면 α가 유의수준이 된다.
○ 일반적으로 α는 0.1, 0.05, 0.01을 주로 사용한다.
유의수준 혹은 크기 α를 사용하는 가설검정의 귀무가설의 채택과 기각은 다음과 같이 선택된다.
○ α보다 p값이 작다면 귀무가설을 기각한다.
○ α보다 p값이 크다면 귀무가설을 채택한다.
양방향 문제(t-검정) |
모집단평균에 대한 양방향 가설검정에 대해 크기 α 검정은 다음과 같다.
검정통계의 값 |t|가 다음과 같이 기각영역에 있다면 귀무가설을 기각한다.
검정통계의 값 |t|가 다음과 같이 채택영역에 있다면 귀무가설을 채택한다.
신뢰구간과 가설검정 간의 관계 |
양방향 가설검정에 대해 만약 p-값이 α보다 크다면, 1-α 수준의 양방향 신뢰구간 이내에 가 존재한다.
○ 1-α 수준의 양방향 신뢰구간 이내에 가 존재한다면, 크기 α를 사용한 가설검정은 귀무가설을 채택한다.
○ 1-α 수준의 양방향 신뢰구간 이내에 가 존재하지 않는다면, 크기 α를 사용한 가설검정은 귀무가설을 기각한다.
모집단평균에 대한 단방향 추론(t-검정) |
단방향 가설에 대한 크기 α 검정은 다음과 같다.
다음과 같다면 귀무가설을 기각한다.
다음과 같은 상황에서는 귀무가설을 채택한다.
1-α 수준의 상방 신뢰구간은 다음과 같다. 이 가설 검증 문제는 α보다 큰 p값을 가지는 값으로 구성되어 있다.
가설검정가 신뢰구간의 관계는 다음 그림과 같다.
모집단평균에 대한 단방향 추론(t-검정) |
단방향 가설에 대한 크기 α 검정은 다음과 같다.
다음과 같다면 귀무가설을 기각한다.
다음과 같은 상황에서는 귀무가설을 채택한다.
1-α 수준의 상방 신뢰구간은 다음과 같다. 이 가설 검증 문제는 α보다 큰 p값을 가지는 값으로 구성되어 있다.
가설검정과 신뢰구간의 관계는 다음 그림과 같다.
가설검정의 검정력(Power of hypothesis Test) |
가설검증의 검정력은 다음과 같이 정의된다.
이는 귀무가설검정이 거짓일 때 귀무가설이 기각되는 확률을 나타낸다.
큰 검정력 수준과 짧은 신뢰구간은 둘 다 실험(Experiment)의 정밀도를 증가시키는 것을 의미한다.
가설검정과 신뢰구간은 다음그림과 같은 유사성을 가진다.
z-검정(z-Test) |
z-검정은 앞선 방식과는 약간 다르게 표준정규분포를 사용하여 검정을 수행한다.
t-검정과 z-검정은 과정이 동일하게 진행되나 다음과 같은 차이가 있다.
○ t-검정은 모집단 분산 σ을 모르는 경우이며, t-분포를 사용하여 검정을 한다.
○ z-검정은 모집단 분산σ을 아는 경우이며, 표준정규분포를 사용하여 검정을 한다.
양방향 z 검정 |
z-검정에서 양방향 가설검정 문제에 대해 p-값은 다음과 같이 표현이 가능하다.
이때 조건은 n개의 관측치의 표본평균은 ,이고 알고 있는 모집단 표준편차 σ값을 사용한다.
는 표준 정규누적분포함수(Standard Normal Cumulative Distribution Function)이다.
z는 z-통계량(z-statistic)으로 불리며 다음과 같이 계산된다.
크기 α 검정은 만약 검정 통계 |z|가 다음과 같은 기각영역에 존재할 경우 귀무가설을 기각한다.
크기 α 검정은 만약 검정 통계 |z|가 다음과 같은 채택영역에 존재할 경우 귀무가설을 기각한다.
모집단평균에 대한 단방향 추론 |
단방향 가설검정 문제에 대해 p값은 다음과 같이 표현이 가능하다.
이때 조건은 n개의 관측치의 표본평균은 ,이고 알고 있는 모집단 표준편차 σ값을 사용한다.
는 표준 정규누적분포함수(Standard Normal Cumulative Distribution Function)이다.
z는 z-통계(z-statistic)로 불리며 다음과 같이 계산된다.
다음과 같다면 귀무가설을 기각한다.
다음과 같다면 귀무가설을 채택한다.
1-α 수준의 신뢰구간은 다음과 같다. 이 가설 검증 문제는 α보다 큰 p-값을 가지는 값으로 구성되어 있다.
모집단평균에 대한 단방향 추론 |
단방향 가설검정 문제에 대해 p값은 다음과 같이 표현이 가능하다.
이때 조건은 n개의 관측치의 표본평균은 ,이고 알고 있는 모집단 표준편차 σ값을 사용한다.
는 표준 정규누적분포함수(Standard Normal Cumulative Distribution Function)이다.
z는 z-통계(z-statistic)로 불리며 다음과 같이 계산된다.
다음과 같다면 귀무가설을 기각한다.
다음과 같다면 귀무가설을 채택한다.
1-α 수준의 신뢰구간은 다음과 같다.
'Mathematics > 확률과 통계' 카테고리의 다른 글
이산데이터 분석(모비율기반 추론, 두 모비율 비교)-확률과통계(25) (0) | 2020.08.13 |
---|---|
두개의 표본 비교-확률과통계(24) (0) | 2020.08.11 |
가설검정(귀무가설, 대립가설, p-값)-확률과통계(22) (0) | 2020.08.08 |
신뢰구간추정(스튜던트 t-분포, 표준정규분포)-확률과통계(21) (0) | 2020.08.04 |
점추정(적률법, 최대우도추정)-확률과통계(20) (0) | 2020.08.03 |
댓글