귀무가설과 대립가설
Updated:
통계적가설은 일정한 형식을 따라야 해요.
귀무가설(Null hypothesis: $H_0$)과 대립가설(Alternative hypothesis: $H_1$)을 그 형식이라고 해요. 통계적 가설 검정을 하려면 우선 두 가지 형식적 가설을 설정해야 해요. 그리고 그 둘 중 하나를 채택해요.
1. 귀무가설
- 귀무가설의 정의 : 모집단의 특성에 대해 옳다고 제안하는 잠정적인 주장
- 귀무가설의 예시 : 20세 이상의 성인 남자평균키는 173cm와 같다. (또는 차이가 없다.), 개발한 신약은 효과가 없다. (또는 차이가 없다.)
- 즉, 귀무가설은 ~와 차이가없다. ~의 효과는 없다. ~와 같다. 라는 형식으로 설정되요.
2. 대립가설
- 대립가설의 정의 : 귀무가설이 틀렸다고 판단됬을때, 대안적으로 선택하는 가설
- 대립가설의 예시 : 20세 이상의 성인 남자평균키는 173cm와 다르다. (또는 차이가 있다.), 개발한 신약은 효과가 있다. (또는 차이가 있다.)
- 즉, 대립가설은 ~와 차이가 있다. ~의 효과는 있다. ~와 같지않다. 라는 형식으로 설정되요.
3. 유의성 검정
수집한 표본 데이터를 바탕으로 귀무가설이 옳은지(채택, Accept) 아니면 옳다고 볼 수 없는지(기각, Reject)를 판단해야 해요. 이를 귀무가설의 유의성 검정이라고 해요. 표본을 추출하고 그 표본으로부터 얻은 정보를 기초로 하여 귀무가설이 참인지 거짓인지를 판정해요. 따라서 항상 오류의 가능성은 존재합니다. 따라서, 귀무가설이 참인지 아닌면 거짓인지를 검증하기 위해 수집한 표본을 바탕으로 귀무가설이 참이라고 가정했을 때, 표본으로 부터 얻어지는 통계치가 나타날 확률을 계산해요. 이를 P-value라고 해요.
4. P-value
P-value가 낮다는 것은 귀무가설이 참이라는 가정 하에서 표본을 추출했을 때, 이런 표본 평균이 관측될 확률이 낮다는 것을 뜻해요. 즉, P-value가 매우 낮으면, 이러한 표본 통계량은 우연히 나타나기 어렵기 때문에, 귀무가설을 기각하고, 대립가설을 채택해요.
5. Etc
제가 귀무가설과 대립가설에 대한 개념이 어렵고 가설 설정하는게 정리가 안되서 포스트를 하게 되었지만, 제가 앞서 설명한 내용은 아주아주 간단하게 설명을 했기 때문에 좀 더 찾아보시면서 비교하시면 좋을것 같아요.
Leave a comment