모비율
정의
> 모집단의 어떠한 사건에 대한 확률 p를 추정하고자 할 때, p에 대한 추정량인 비율은 p(hat)=Xbar/n 이다.
p hat은 p의 추정량이라고 생각하면 된다.
목적
> 모집단의 모수를 비율, 확률로써 알고 싶을 때 사용한다.
점추정
모수 : 모집단에서 A라는 특성을 갖는 집단의 비율 : 모비율 p
자료 : 크기가 n인 표본에서 A라는 특성을 갖는 개체의 수 : X
추정량 : 표본비율 : p hat = Xbar/n
표준오차 : S.E.(p hat)=√[p(1-p)/n], 추정된 표준오차 = √[p hat(1-p hat)/n]
X에 대한 기댓값과 표준편차는 np, √np(1-p) 이다.
모비율 p에 대한 추정량이 표본비율인 것은, 표본이 충분히 크다면, 표본평균이 모평균으로 향한다는 중심극한정리로 인해 표본비율 : p hat = Xbar/n 이다.
예제-1
1만명의 고객명단에서 250명을 추출, 그 중에서 70명이 구입을 희망하였다. 그 상품을 구입하려는 모비율 p를 추정하고 추정량의 표준오차를 구하시오.
모비율 p에 대한 추정량은 표본비율이므로, p hat은 70/250 = 0.28
p hat의 표준오차를 구하면, √[p hat(1-p hat)/n]=0.028
모비율에 대한 신뢰구간
표본크기에 대한 모비율 결정
P[ | p hat - p ≤ d| ] ≥ 1-α (d는 모비율들의 차)
P[ | (p hat - p) / (√[p(1-p)/n]) ≤ Z(α/2)| ] ≥ 1-α (Z는 정규분포에서의 특정 값들)
n ≥ (Z(α/2)/d)**2 * p(1-p)
p가 결정되지 않았다면, n이 최대가 나오게 해야하기 때문에, p가 0.5일 때 n이 최대로 나온다.
p가 나왔다면, p값을 넣어서 대입하면 된다.
예제-2
Q. 시력장애자의 비율p를 추정하고자 한다. 만약 p에 대한 추정량의 오차가 0.05이하가 될 확률이 98%가 되기를 원한다면, 몇 명을 대상으로 시력장애 여부를 조사해야겠는가??
p hat - p = 0.05이하라고 문제에 적혀있다. d = 0.05이고 α=0.02로부터 Z(0.01) = 2.33 따라서 n은 543이상이다.
예제-3
Q. 어느 도시의 교육청에서는 올해부터 실시한 수돗물의 불소화 시행이 그 지역 초등학생 중 충치가 있는 비율에 어떤 변화를 주었는지 관심이 있다고 한다. 올해 초등학생의 충치비율을 p라고 하자. 초등학생의 충치비율이 60%는 넘지 않는다고 알려져있을 때, p에 대한 추정량의 95%의 오차범위가 0.03을 넘지 않으려면 몇 명의 학생을 검사해야하는가??
P[ | (p hat - p) / (√[p(1-p)/n]) ≤ Z(α/2)| ] ≥ 1-α 을 그대로 적용해보면!
P[ | (p hat - p) / (√[p(1-p)/n]) ≤ 1.96| ] ≥ 0.95
Z(α/2)√[p(1-p)/n] ≤d, 이 때 p는 60% 는 넘지 않기 때문에 60% 밑으로 내려갈 수도 있다.
따라서 p는 0.5로 했을 때의 n이 최댓값이 나오기 때문에, 계산해보면 (1.96/d = 0.03)**2*0.5**2 = 1068
여기서는 p가 0.6이 아니라, 0.5라는 것을 캐치해야한다.
문제에서 모비율 p에 대한 정보가 안주어지는 경우가 있다. 그때는 최대의 n을 측정해야하기 때문에 0.5라고 하면 되지만, 만약 p가 특정 p를 넘지않는다고 가정을 주면, 그 p 밑으로 최대의 값을 지정해서 n을 추정하면 된다.
'AI' 카테고리의 다른 글
Statistics : 회귀분석 : 모형, 최소제곱법을 이용한 모수 추정 (0) | 2020.01.13 |
---|---|
Statistics : 정규모집단에서의 추론 : t 분포 (0) | 2020.01.11 |
Statistics : 10-3 : 통계적 추정 : 가설검증 (가설의 정의, 오류의 종류) (0) | 2020.01.11 |
Statistics : 10-3 : 통계적 추정 : 가설검증 (검정통계량, 기각역의 결정, 유의확률) (0) | 2020.01.08 |
Statistics : 8-5 : 정규분포가정의 조사 (0) | 2020.01.07 |
댓글