본문 바로가기
AI

Statistics : 정규모집단에서의 추론 : t 분포

by 월곡동로봇팔 2020. 1. 11.

T 분포

 

배경

> 모집단의 분포가 N(μ,σ**2) 일 때, 크기가 n인 표본의 평균 X bar의 분포는 정확하게 N(μ,σ**2/n)다.

하지만, 일반적으로는 σ는 미지수이기 때문에, 표본에서의 표준편차 s를 이용해서 적용하게 되는데,

이 때!!!!!!! n이 큰 경우에는 정규분포를 따라서 그대로 s를 적용하면 되지만, n이 작은 경우에는 자유도에 따라서 t분포를 따른다.

정의

> 정규모집단 N(μ,σ**2) 일 때, 추출된 표본을 X1, X2 ---- Xn이라고 할 때, 표본평균과 표본분산은
Xbar = ∑Xi/n, s**2 = ∑(Xi - Xbar)**2/(n-1) 라고 정의하면, 표준화된 확률변수 t = (Xbar-μ)/s/√n 는 자유도가 n-1인 t분포를 따른다.

t분포의 확률밀도함수, 누적분포함수

즉, t분포는 1. 표본의 크기가 작은 경우, 2. σ를 s로 대체하면서, 3. 자유도를 고려한 분포이다.

(σ를 알고 있다면, )

n이 클수록 t분포는 신뢰구간이 좁아지면서 표준정규분포를 따르게 된다.

 

t분포에서의 모평균에 대한 추론 (표본의 크기가 작을 때)

구간추정이나 검정의 경우에는 표본의 크기가 작을 때, 정규분포를 그대로 사용하지 못하고 t분포를 사용하기 때문에,

t분포일 때의 모평균에 대한 구간추정, 구간검정에 대해 적을 것이다.

 

t분포에서의 모평균에 대한 구간추정

t분포에서의 모평균에 대한 가설검정

위의 t검정은 Z검정과 굉장히 유사하다. Z를 t로 바꾸기만 하면 된다.

 

예시-1

Q. 단위부피당 평균 세균수가 있는데, 그 수가 200이상이면 상수원으로 적합하지 않다고 한다. 호수의 10군데에서 물을 떠서 조사한 결과, 단위부피당 세균수는 다음과 같다.

175 190 215 198 184 207 210 193 196 180

이 자료로부터 호수의 단위부피당 평균세균수μ 가 200보다 적다고 주장할 수 있는가?

호수의 단위부피당 세균의 수가 정규분포를 따른다고 가정해보면, 표본의 크기도 작고 모표준편차도 알려져 있지 않기때문에 t분포를 사용해야 한다.

 

H0 : μ = 200 // H1 : μ < 200

 

H0일 때, t = (Xbar - 200) / (s / √10) 는 자유도가 9인 t분포를 따른다.

따라서 유의수준(H0가 기각이 되는 지점) 0.05에서 기각역 R : t < -t = -1.833

 

t의 관측값을 구해보면, Xbar = 194.8, s = 13.14 이기 때문에 t0 = -1.2514

 

t0가 -1.833 보다 크기 때문에, 유의수준 0.05에서 귀무가설을 기각할 수 없다.

 

따라서 "평균값이 200보다 작지는 않을 것이다. " 라는 결론이 나온다.

 

 

 

 

μ

σ

 

 

댓글