본문 바로가기

통계

가설검증

영가설, 귀무가설

 

  • 연구자가 부정하고자 하는 내용이 담긴 가설

 

대립가설

 

  • 연구자가 주장하고자 하는 내용이 담긴 가설, 영가설이 기각되었을 때 TRUE가 되는 진술

 

1종의 오류

 

  • 영가설이 참인데 영가설을 기각하여 대립가설을 채택하는 판단의 오류  α 로 표시

 

2종의 오류

 

  • 영가설이 참이아니고 대립가설이 참일 때 영가설을 채택하는 오류 β로 표시

통계적 검증력

 

  • 영가설이 참이 아닐 때  영가설을 기각하는 확률. 즉 대립가설이 참일 때 대립가설을 채택하는 확률 1- β로 표시 

유의 수준

 

  • 가설검증에서 영가설이 참일때 이 영가설을 잘못되었다고 오판 하는 확률을 얼마나 감수할 것인지 결정하는 것을 의미한다. 즉, 1종의 오류를 얼마나 허용할 것인가에 대한 것.(ex 100번 중 5번까지 허용=> .05 100번 중 1번까지 허용=>. 01
  • α로 표기, .05, .01, .001로 보통 설정한다.

 

유의 확률

 

  • 표본평균 분포에서 연구자의 표본에서 얻는 표본 통계량(ex 표본평균)보다 더 극단적인 값을 얻을 확률

 

등가설 

 

  • 영가설과 대립가설을 차이가 있다 없다로 판단하는 가설
  • 양방검증을 실시한다

 

부등가설

 

  • 영가설 과 대립가설에 크기 비교가 있는 가설. 등호는 영가설에 존재
  • 일방검증을 실시 

 

그래프로 보기

H0그래프는 영가설이 참일 때의 표본평균분포이고 Ha는 대립가설이 참일때의 표본평균분포이다. 빨간색 부분은 임계치 바깥이므로 기각하는 영역 속해있으나 사실 영가설이 참인 부분이므로 1종 오류(유의 수준)  α 이다. 주황색 영역은 임계치의 안에 있는 채택 영역이므로 영가설을 채택하지만 사실 대립가설이 참인 영역이므로 2종의 오류  β이다. 보라색영역은 영가설이 기각되는 영역이면서 대립가설이 참인 영역이므로 통계적 검증력 1-β이다.

 

예시

 

대학생의 평균 IQ가 N(100, 15제곱)을 따른다고 가정.  A대학교 학생들의 IQ가 대학생 평균보다 높다는 가설을 검증

 

H0= A대학교의 평균 IQ의 분포는 N(100, 15제곱)을 따른다. 

HA= A대학교 학생들의 평균 IQ는 대학생 평균보다 높다.

 

9명의 학생들을 표본으로 뽑아 조사한 x의 평균IQ =112이고 유의 수준 α=.05수준에서 귀무가설 기각 확인

 

귀무가설을 사실이라했을 때 9명을 표본크기로하는 표본 평균의 분포의 평균은 모집단 평균과 같으므로 100, 표준오차는 표준편차/제곱근9이다. x~N(100, 5) 표준화 시키면 N(0, 1)이다. 112를 표준화 시키면 (112-100)/5= 2.4이다. 단측 검증이므로 .05보다 높은 임계치는 1.64이다. 2.4>1.6이므로 기각역에 속해 귀무가설을 기각되었고 HA가 채택되었다. 

 

유의 확률에 의해 계산해 보면 2.4 보다 큰 영역에 속할 유의 확률은

'통계' 카테고리의 다른 글

불편파 추정치  (0) 2021.01.19
표집 분포  (0) 2021.01.18
추리 통계의 기초  (0) 2021.01.16