본문 바로가기
AI

Statistics : 9-3 : 표본평균, 대수의 법칙

by 월곡동로봇팔 2019. 12. 26.

표본평균


표본평균 정의 및 구하는 이유

정의
> (관측된 데이터의 합계) / (관측 데이터 총 개수) <모평균과 구별하기 위해 X bar로 표현>
> 여러 데이터를 관측하여 그 평균을 구한 것

표본평균을 구하는 이유
> "우연히 생긴 흩어진 데이터를 없애고, 실제의 값에 가까운 값을 만들어 내고 싶기 때문이다."
> 모평균은 모집단의 중심을 나타내는 수치로써 가장 많이 사용하고 집단의 특성을 잘 나타낸다.

대수의 법칙 (중심극한정리와 헷갈리지 말기!)

주사위 횟수에 따른 분포

위에 첫 번째 그림은 주사위를 한 번 던졌을 때의 표본평균이라고 하고, 두 번째 그림은 주사위를 두 번 던졌을 때의 표본평균이라고 하자. 

 

n=1, n=2일 때로 n이 커질수록 표본평균이 3.5로 향하는 것을 알 수 있다.

즉, n이 커질수록 표본평균이 모평균에 가까워지는 것을 알 수 있다.

하나의 모집단에서 n개의 데이터를 관측하고 그 표본평균 X bar을 만든다. 이 때 n 이 크면 클수록 표본평균은 모평균에 가까운 수치로 향한다.

정규모집단에서의 표본평균의 성질

> 모집단의 모평균이 μ 이고, 모표준편차가 σ 일 때, 임의추출된 표본의 표본평균 X bar는 표본의 크기 n 이 큰 경우, 데이터 n개의 표본평균에 대한 95% 예언적중구간은 μ-1.96σ/n ~ μ+1.96σ/n이다. (중심극한정리)

> 표본평균을 만드는 개수가 늘어날수록 예언하는 구간이 좁아진다. (분모가 작아짐 -> 오차가 작아짐)

결론

> 데이터가 충분히 큰 상황에서는 중심극한정리에 의해, 표본집단의 표본평균과 표본표준편차가 μ, σ/n으로 정해진다. 따라서 모표준편차를 알고 있을 때의 모평균의 예언적중구간(제일 많이 씀, ex) 기계들은 모두 표준편차, 즉 오차를 가지고 있음), 모평균을 알고 있을 때의 모포준편차의 예언적중구간, 둘 다 모를 때의 해법 3가지를 알고 있어야 한다.

댓글