표본평균
표본평균 정의 및 구하는 이유
정의
> (관측된 데이터의 합계) / (관측 데이터 총 개수) <모평균과 구별하기 위해 X bar로 표현>
> 여러 데이터를 관측하여 그 평균을 구한 것
표본평균을 구하는 이유
> "우연히 생긴 흩어진 데이터를 없애고, 실제의 값에 가까운 값을 만들어 내고 싶기 때문이다."
> 모평균은 모집단의 중심을 나타내는 수치로써 가장 많이 사용하고 집단의 특성을 잘 나타낸다.
대수의 법칙 (중심극한정리와 헷갈리지 말기!)
위에 첫 번째 그림은 주사위를 한 번 던졌을 때의 표본평균이라고 하고, 두 번째 그림은 주사위를 두 번 던졌을 때의 표본평균이라고 하자.
n=1, n=2일 때로 n이 커질수록 표본평균이 3.5로 향하는 것을 알 수 있다.
즉, n이 커질수록 표본평균이 모평균에 가까워지는 것을 알 수 있다.
하나의 모집단에서 n개의 데이터를 관측하고 그 표본평균 X bar을 만든다. 이 때 n 이 크면 클수록 표본평균은 모평균에 가까운 수치로 향한다.
정규모집단에서의 표본평균의 성질
> 모집단의 모평균이 μ 이고, 모표준편차가 σ 일 때, 임의추출된 표본의 표본평균 X bar는 표본의 크기 n 이 큰 경우, 데이터 n개의 표본평균에 대한 95% 예언적중구간은 μ-1.96σ/√n ~ μ+1.96σ/√n이다. (중심극한정리)
> 표본평균을 만드는 개수가 늘어날수록 예언하는 구간이 좁아진다. (분모가 작아짐 -> 오차가 작아짐)
결론
> 데이터가 충분히 큰 상황에서는 중심극한정리에 의해, 표본집단의 표본평균과 표본표준편차가 μ, σ/√n으로 정해진다. 따라서 모표준편차를 알고 있을 때의 모평균의 예언적중구간(제일 많이 씀, ex) 기계들은 모두 표준편차, 즉 오차를 가지고 있음), 모평균을 알고 있을 때의 모포준편차의 예언적중구간, 둘 다 모를 때의 해법 3가지를 알고 있어야 한다.
'AI' 카테고리의 다른 글
Statistics : 9-3 : 중심극한정리 (0) | 2019.12.26 |
---|---|
Statistics : 9-1 : 모집단, 통계량, 모수 (0) | 2019.12.26 |
Statistics : 10-2 : 통계적 추정 : 구간추정 (0) | 2019.12.22 |
Statistics : 10-1 : 통계적 추정 (0) | 2019.12.22 |
Statistics : 8-1,2,3 : 정규분포 (0) | 2019.12.22 |
댓글