본문 바로가기
AI

Statistics : 10-3 : 통계적 추정 : 가설검증 (검정통계량, 기각역의 결정, 유의확률)

by 월곡동로봇팔 2020. 1. 8.

검정통계량 (Test Statistics)

 

정의

> 표본으로부터 검정의 결론, 즉 H0을 기각하거나 H0을 기각하지 않고 유지하는 결정을 내릴 때, 이용되는 표본의 함수, 즉 통계량을 검정통계량

2019/12/22 - [ML/statistics] - Statistics : 통계적 추정 : 가설검증 (가설의 정의, 오류의 종류)

 

Statistics : 통계적 추정 : 가설검증 (가설의 정의, 오류의 종류)

가설검증 (귀납적 방법, Testing Statistical hypothesis) 2019/12/22 - [ML/statistics] - Statistics : 통계적 추정 Statistics : 통계적 추정 통계적 추정 우리는 앞에서 표준정규분포에 대해 공부했다. 2019/1..

mambo-coding-note.tistory.com

위의 포스팅에서 예시-1 에서 든 예시에서 보면, 우리가 "H1을 모평균이 200에 비해 상당히 작을 때이고, H0를 모평균 200일 때를 가정" 할 때이다.

따라서 H0을 기반으로 Xbar가 200에 근사한다고 가정할 때, Xbar ≤ c 일 때 H0을 기각하게 된다.

 

기각역 (Critical region)

> H0 = 귀무가설 // H1 = 대립가설
> H0을 기각하는 구간을 기각역 
> H0을 기각했는데 H0가 맞을 경우 = 1종오류를 범하게 되는 확률을 α
> H0을 채택했는데 H0가 틀릴 경우 = 2종오류를 범하게 되는 확률을 β

귀무가설은 1. "=" 으로 무조건 설정하자 2. 틀릴 것 같은 사건을 귀무가설로 설정하자.  

 

여기서 가장 바람직한 기각역은 두 확률을 최소화시키는 것이 될 것이다.

 

  • H0가 맞을 때 (μ = 200 일 때) : α = P(Xbar ≤ c)
  • H0가 틀릴 때 (μ < 200 일 때) : β = P(Xbar > c)

기각역

위의 그림에 따로 맞춰보면, 아래와 같다.

  • H0가 맞을 때 (μ = 200 일 때) : α = P (Xbar ≥ c)
  • H0가 틀릴 때 (μ > 200 일 때) : β = P (Xbar < c)

위의 그림에 맞춰보면, c를 작게 하면, α가 커지고 c를 크게 한다면, α가 줄어든다.

우리는 α에 초점을 맞춘다. H0은 귀무가설이기 때문에, 보통은 대립가설은 틀릴 수도 있지만, 귀무가설이 틀리는 경우는 다반하지 않기 때문에, 귀무가설에 기준으로 맞춰야지 우리가 적은 계산으로 확실한 결과를 알 수 있기 때문이다.

따라서 넓이 α를 0.05, 0.1, 0.01 로 맞춰둔다.

 

유의수준 (Significance level)

> 선택된 기각역에서의 H0 하에서의 확률 α를 유의수준이라고 한다. (H0 귀무가설이 실제로 맞는데, 이를 기각해서 오류를 범할 확률!!! 우리는 유의수준 α를 굉장히 중요하게 생각한다.)

이 때, 유의수준 α인 기각역은 P(Z≤-Zα) = α로부터 R : Xbar μ-Zα*s/√n 이 된다.

따라서 표본이 Z≤-Zα 를 성립하는가의 여부를 가린 후에 검정의 결론을 내린다.

위와 같은 검정을 Z-Test라고 한다.

만약 모집단의 평균이 200보다 크다고 할 때를 보면, Z>Zα 로 변한다.

따라서 H1의 경우에 따라 단측검정과 양측검정으로 나뉜다.

양측검정일 때는 색칠된 부분은 α/2, α/2, 단측검정일 때는 색칠된 부분이 α이다.

 

단측검정, 양측검정
Z 검정

유의확률 (Significance Probability)

> 주어진 검정통계량의 관측치로부터 H0를 기각하게 하는 최소의 유의수준을 말한다.
> p_value가 작을수록 더욱 확실하게 H0를 기각할 수 있다. == Z=-2.22 일 때 5% 의 유의수준을 가진다. 만약 -2.22 보다 작은 Z라면, 기각역에 포함이 안될 것이다. 따라서 Z가 -2.22보다 같거나 큰 Z라면, 기각역에 포함되기 때문에, 최소한의 유의수준을 가지려면, d가 -2.22가 되어야한다.

p value < 원하는 유의수준 : H0를 기각

p value > 원하는 유의수준 : H0를 채택

 

P-Value는 컴퓨터가 구해주니 이는 걱정하지 말자.!!!

P-Value의 의미가 제일 중요하다.

 

예시-1

Q. 중학생의 키 자료로부터 그 도시의 중학교 1학년 남학생의 평균키가 다른 도시의 중학교 1학년 남학생의 평균키인 159cm와 차이가 있다고 할 수 있는가???

(표본의 크기는 30이상, 표본평균이 160.2, 표본표준편차가 5.99)

H0 : μ = 159 // H1 : μ ≠ 159

 

P-Value를 구해보면, z == 1.10 이므로 |Z| >1.10, P-value = 0.2714

P-Value는 H0를 기각할 수 있는 최소의 유의수준이므로, H0를 기각하려면 P-Value보다는 무조건 커야한다.

따라서 원하는 유의수준이 P-Value보다 클 때만 H0를 기각할 수 있다.

 

우리가 유의수준이 0.01, 0.05, 0.1인 점을 고려해보면, 귀무가설 H0는 옳지않다고 판단 가능하다.

따라서 모집단의 평균은 159로 수렴하지 않는다는 결론을 낼 수 있다.

 

예시-2

Q. 모평균에 대한 귀무가설 H0, 대립가설 H1을 구하라, 또한 기각역 중에서 어느 기각역이 적당한지 적으라.

1. 새로운 수술에 따르는 집중치료에 필요한 평균 시간은 13.5시간보다 적다
2. 유명상표 초코 아이스크림의 지방 함유량은 표지에 적힌 2%보다 많다.
3. 모터의 평균 무게는 제조회사의 목표치인 6kg과 차이가 있다.

1. H0 : μ = 13.5 // H1 : μ < 13.5 // R : Xbar ≤ c or R: Z ≤ -Zα

2. H0 : μ = 0.02 // H1 : μ > 0.02 // R : Xbar  c or R: Z Zα

3. H0 : μ = 6 // H1 : μ ≠ 6 // R : | Xbar |  c or R: |Z|  Z(α/2)

 

예시-3

Q. (수술에 대한 예시) 표본으로부터 귀무가설을 기각하는 결정을 했다. 
1-1. 어떤 상황에서 귀무가설을 기각하는 결정은 옳은 것인가?
1-2. 그러한 결정이 잘못되었을 때 어떠한 종류의 오류가 행해졌는가?

Q. 표본으로부터 귀무가설을 채택하는 결정을 했다. 
2-1. 어떤 상황에서 귀무가설을 채택하는 결정은 옳은 것인가?
2-2. 그러한 결정이 잘못되었을 때 어떠한 종류의 오류가 행해졌는가?

1-1 . μ < 13.5, R : Xbar ≤ c or R: Z ≤ -Zα 일 때

1-2 . 제 1종오류 : 실제로 H0가 맞는데 H1이라고 예측하는 오류

 

2-1 . μ = 13.5, R : Xbar  c or R: Z  -Zα 일 때

2-2 . 제 2종오류 : 실제로 H1이 맞는데 H0라고 예측하는 오류

댓글