본문 바로가기
반응형

통계34

두개의 표본 비교-확률과통계(24) 두개의 표본 비교 본 포스팅에서는 두 개의 표본(짝을 이룬 표본, 독립적인 두 표본)을 비교하는 방법에 대해 다루도록 한다. 짝을 이룬 표본의 비교 아래와 같은 모집단 A, B의 집합이 있다고 가정하자. ○ 누적 분포함수를 가지는 모집단 A에서의 데이터 관측치 의 집합 ○ 누적 분포함수를 가지는 모집단 B에서의 데이터 관측치 의 집합 위의 두개의 모집단에서 과 를 비교하는데 두 모집단에서 분산이 다를 경우라면,두 모집단에서 표본 추출을 무작위로 선정하는 것이 좋은 방법이다. ○ 무작위 표본추출은 특정 종류의 대상이 선호되는 것에서 발생할 수 있는 편향성을 제거하는 데 도움을 준다. ▷ 맹검법(Blind experiment), 이중맹검법(double-blind experiment), 플라시보(Placebo.. 2020. 8. 11.
가설검정(유의수준, t-검정, z-검정)-확률과통계(23) 가설검정(유의수준, z-검정) 본 포스팅에서는 유의수준(Significance level)과 표준정규분포를 이용한 z-검정에 대해서 다룰 것이다. 가설검정의 유의수준(Significance level) 오류의 종류: 검정을 수행할 때 다음과 같은 오류가 존재한다. ○ 1종오류(type I error): 귀무가설이 참일때 이를 잘못 기각함으로써 발생하는 오류 ▷ 1종 오류의 발생 가능성은 α보다 크지 않다. ○ 2종오류(type II error): 귀무가설이 거짓일때 이를 잘못 채택함으로써 발생하는 오류 유의수준(Significance level)은 가설검정에 사용되는 기준값으로써, 1종 오류 확률의 상한으로 정의된다. ○ 신뢰수준이 1-α라면 α가 유의수준이 된다. ○ 일반적으로 α는 0.1, 0.05,.. 2020. 8. 9.
가설검정(귀무가설, 대립가설, p-값)-확률과통계(22) 가설검정(귀무가설, 대립가설, p-값) 본 포스팅에서는 귀무가설(Null hypothesis)과 대안가설(Alternative hypothesis)에 대한 설명과, 가설검정을 위해 사용하는 p-값(p-value)에 대해 설명한다. 귀무가설(Null hypothesis)과 대안가설(Alternative hypothesis) 가설검정에 대해 다루기에 앞서 귀무가설과 대안가설이 무엇인지 설명하도록한다. ○ 귀무가설(Null hypothesis): 모집단 확률변수와 추정치가 차이가 없다는 가설이다. ▷ 영가설이라고도 불린다. ▷ 수학적 기호로 라고 표현한다. ○ 대안가설(Alternative hypothesis): 모집단 확률변수와 추정치가 차이가 있다는 가설이다. ▷ 수학적 기호로 라고 표현한다. 아래에 열거.. 2020. 8. 8.
신뢰구간추정(스튜던트 t-분포, 표준정규분포)-확률과통계(21) 신뢰구간추정(t-분포, 표준정규분포) 본 포스팅에서는 신뢰구간에 대한 설명(Confidence interval)과 스튜던트 t-분포(Student's t-distribution), 표준정규분포(Standard Normal Distribution)을 사용하여 신뢰구간을 추정하는 방법에 대해 서술하도록 한다. 신뢰구간(Confidence interval)이란?신뢰구간(Confidence interval)은 신뢰수준의 확률로 알려지지 않은 매개변수(Parameter) 가 있을 것으로 예상되는 구간이다. ○ 예를들어 신뢰수준이 95%인 구간 (A,B)가 있다면 해당 매개변수는 구간 (A,B)에 있을 확률이 95%이다. 신뢰수준(Confidence level)신뢰수준(Confidence level)은 매개변수가 .. 2020. 8. 4.
점추정(적률법, 최대우도추정)-확률과통계(20) 점추정(적률법, 최대우도추정) 본 포스팅에서는 점추정(Point estimate) 중 적률법(Method of Moments)과 최대우도추정(MLE, Maximum Likelihood Estimates)에 대해 다루도록한다. 적률법(Method of Moments) 적률법(Method of Moments)은 점추정방법 중 하나로 적률을 이용하여 모수를 점추정하는 방법이다. ○ 적률과 적률생성함수에 대한 설명은 이 링크(여기)에 있다. ○ 설명이 어렵지만 쉽게 설명해서 를 적률이라하며 이를 이용하여 점추정을 수행하는 방법이다. ▷ 아래 나오지만 실제로 평균을 추정하기 위해 를 사용한다. 한개의 매개변수에 대한 모수추정 점평가만약 알려지지 않은 매개변수 에 의존적인 확률분포로부터의 관측치 의 데이터 집합이 .. 2020. 8. 3.
점추정(비편향추정,최소분산평가)-확률과통계(19) 점추정(비편향추정,최소분산평가) 본 포스팅에서는 점추정, 그 중에서도 비편향추정(Unbiased Estimate)과 최소분산평가(Minimum Variance Estimate)에 대해 다루도록한다.좀 더 상세히는 비편향추정 중 성공확률의 점추정과 모집단평균 및 분산의 점추정, 최소분산평가 중 최소분산비편향평가(MVUE, Minimum Variance Unbiased Estimate), 상대효율(Relative efficiency), 평균좌승에러(MSE, Mean Squared Error) 등에 대해 설명한다. 비편향 추정(Unbiased Estimate) 점추정 매개변수 에 대한 는 아래와 같은 상황에서는 비편향(Unbiased)되었다고 불려진다. 만약 점추정이 비편항적이지가 않다면, 이것의 편향성(bi.. 2020. 8. 2.
표본분포(표본비율, 표본평균, 표본분산)-확률과통계(18) 표본분포(표본비율, 표본평균, 표본분산) 본 포스팅에선 표본분포에 대해 다루도록 한다.포본분포의 대표적인 예로 표본비율(Sample Proportion), 표본평균(Sample mean), 표본분산(Sample variance)의 분포가 존재한다.좀 더 상세히는 각 표본 매개변수가 어떤분포를 따르는지와, 표준오차(Standard error)에 대해 다룬다. 표본 분포(Sampling Distribution) 표분 분포(Sampling Distribution)는 모집단(Population)에서 임의로 추출하여 크기가 n인 확률표본 중 확률변수의 분포이다. ○ 모집단에서 임의로 추출한 표본은 표본 비율, 표본 평균, 표본 분산과 같은 값을 가질 수 있다. ▷ 표본비율(Sample Proportion): 모집.. 2020. 8. 1.
카이제곱분포, 스튜던트 t-분포, F-분포-확률과통계(17) 카이제곱분포, 스튜던트 t-분포, F-분포 본 포스팅에서는 카이제곱분포(Chi-Squared Distribution), 스튜던트 t-분포(Student's t-Distribution), F-분포(F-Distribution)에 대해 다루도록 한다.그리고 각 분포의 확률밀도함수(PDF), 예상치(평균)과 분산, 특징에 대해 설명해보도록 한다. 카이제곱분포(Chi-Squared Distribution) 카이제곱분포(Chi-Squared Distribution)의 확률변수 X는 ν의 자유도를 가지며 다음과 같이 정의된다.여기서 이며 각 확률변수는 독립적이다.즉, 카이제곱분포는 독립적인 표준정규분포 제곱의 합으로 구성되는 확률분포이며, 그래프는 다음과 같은 형상을 가진다. 중앙극한정리에 따르면 카이제곱분포에서 자.. 2020. 7. 28.
로그정규분포와 다변량정규분포-확률과 통계(16) 로그정규분포와 다변량정규분포 본 포스팅에서는 로그정규분포(Lognormal Distribution)와 다변량정규분포(Multivariate Normal Distribution)에 대해 다루도록한다.로그정규분포에 대해서는 확률밀도함수(PDF), 누적분포함수(CDF), 예상치(평균)과 분산과 그 증명 등에 대해서도 설명하고, 다변량정규분포에 대해서는 이변량정규분포(Bivariate Normal Distribute)와 다변량정규분포로의 일반화에 대해 다루도록 한다. 로그정규분포(Lognormal Distribution) 확률변수 X에 자연로그를 취할때의 분포가 정규분포를 따를 경우 로그정규분포라 한다. ○ 확률변수 X가 로그정규분포를 가지는 경우 아래와 같이 표현한다. ○ 아래 그림과 같이 로그정규분포는 대칭.. 2020. 7. 27.
반응형