본문 바로가기

표준편차2

Statistics : 3-2 : cf) 평균값과 표준편차를 이용한 데이터 분석 한 dataset 중에 있는 어떤 data가 갖는 의미 내 점수가 85점이라고 할 때, 위의 그림을 A 학급, B 학급이라고 하자. 만약 A 학급이라면, 표준편차가 B 학급보다는 작다. 따라서 내 점수는 평균에서 많이 멀어져 있고, 다른사람들도 평균에서 머물러있다는 뜻이므로, 내 점수는 가치가 높다. 만약 B 학급이라면, 표준편차가 A 학급보다는 크다. 따라서 점수 분포가 평균에서 다들 많이 떨어져있으므로, 고득점의 사람들도 A 학급보다는 많다는 의미이기 때문에, 내 점수의 가치는 낮다. 위의 그림처럼, dataset이 만약에 정규분포에 가깝다면??? 평균점수에서 표준편차만큼 높은 정도의 경우는 특수하다고 볼 수 없지만, 평균점수에서 표준편차보다 2, 3배만큼 큰 경우는 특수하다고 볼 수 있다. "특수하.. 2019. 12. 21.
Statistics : 3-3 : 분산, 표준편차 분산(variance), 표준편차 (Standard Deviation) 배경 2019/12/21 - [ML/statistics] - Statistics : 3-2 : 평균값, 중앙값, 최빈값 Statistics : 3-2 : 평균값, 중앙값, 최빈값 평균값 정의 ∑(데이터) / (데이터의 총 갯수)로 나누기해서 얻은 값이다. ∑ (계급값 * 상대도수) 배경 도수분포표나 히스토그램은 몇 가지 단점들을 가지고 있다. 만든 사람의 생각이 들어가니, 실제로 표.. mambo-coding-note.tistory.com 우리가 위에 포스팅에서 통계량은 데이터들이 어떠한 특성을 가지고 있는지, 평균값, 표준편차를 이용해 수치적으로 정한다고 배웠다. 또한 평균값의 특성상 "평균값은 data들이 평균값 주위로 분포해있다.. 2019. 12. 21.