본문 바로가기

통계학2

Statistics : 카이제곱분포 카이제곱분포 배경 모집단이 정규분포를 따르지 않을 때, t분포를 이용한 모평균추론보다, t분포를 이용한 모분산추론이 더 심각한 오류를 만든다. 따라서 모분산은 t분포를 쓰지 않고, 카이제곱분포를 쓴다. 정의 > "표준정규분포 하는 모집단에서 얻은 n개의 data 제곱의 합" == 분산 이라는 통계량을 분석한 것이다. > V = (Xbar - x1)**2 + (Xbar- x2)**2 + (Xbar- x3)**2 ----(Xbar- xn)**2 > χ**2 = V / σ**2 = (n-1)s**2/σ**2 특징 > 감마분포의 특수한 형태 > 자유도 (관측한 데이터의 수) 에 따라 달라진다. > 0 근처의 데이터 상대도수가 크다. > 자유도 n이 커짐에 따라서 가운데 볼록한 높이가 낮아지면서 점점 오른쪽으로 .. 2020. 1. 1.
Statistics : 3-5 : 통계학, 도수분포표 Statistics (통계학) 우리가 살아가는 사회에서의 data들은 항상 "불확실성" 을 가지고 있다. 따라서 우리는 data의 불확싱성의 구조를 찾아내기 위해 이 통계학을 사용한다. 데이터는 항상 "제각각인 구조"를 가지고 있기 때문에, 우리는 이들의 분포와 특징을 알아내기 위해 평균값, 분산, 표준편차를 사용한다. 통계학은 기술통계와 추정 통계로 나뉜다. 기술통계 정의 관측을 통해 얻은 데이터에서 그 데이터의 특징을 뽑아내기 위한 기술 ex) histogram, 도수분포표 추정통계 정의 "전체를 파악할 수 없을 정도의 큰 대상, 아직 일어나지 않은 미래에 일어난 일" 을 파악하는 것이다. 즉 "" 부분으로 전체를 파악하는 일"" 이다. 주로 우리가 머신러닝, 딥러닝으로 예측하는 부분을 추정통계라 한.. 2019. 12. 21.