본문 바로가기

평균값2

Statistics : 3-2 : cf) 평균값과 표준편차를 이용한 데이터 분석 한 dataset 중에 있는 어떤 data가 갖는 의미 내 점수가 85점이라고 할 때, 위의 그림을 A 학급, B 학급이라고 하자. 만약 A 학급이라면, 표준편차가 B 학급보다는 작다. 따라서 내 점수는 평균에서 많이 멀어져 있고, 다른사람들도 평균에서 머물러있다는 뜻이므로, 내 점수는 가치가 높다. 만약 B 학급이라면, 표준편차가 A 학급보다는 크다. 따라서 점수 분포가 평균에서 다들 많이 떨어져있으므로, 고득점의 사람들도 A 학급보다는 많다는 의미이기 때문에, 내 점수의 가치는 낮다. 위의 그림처럼, dataset이 만약에 정규분포에 가깝다면??? 평균점수에서 표준편차만큼 높은 정도의 경우는 특수하다고 볼 수 없지만, 평균점수에서 표준편차보다 2, 3배만큼 큰 경우는 특수하다고 볼 수 있다. "특수하.. 2019. 12. 21.
Statistics : 3-2 : 평균값, 중앙값, 최빈값 평균값 정의 ∑(데이터) / (데이터의 총 갯수)로 나누기해서 얻은 값이다. ∑ (계급값 * 상대도수) 배경 도수분포표나 히스토그램은 몇 가지 단점들을 가지고 있다. 만든 사람의 생각이 들어가니, 실제로 표를 보고 이해하지 못하는 경우가 생긴다. -> 히스토그램에서 하나의 계급값들은 각각의 수치들이 차이가 얼마나 나는지에 대한 부분을 알지 못한다. 따라서 데이터로부터 추출한 성질을 통해서 결론도출이 힘들 수 있다. 상당히 많은 공간을 차지한다. -> 논문에서는 집약적으로 다뤄야하기 때문에, 잘 써야함. 이 단점들을 극복하기위해 축약 방법 중 통계량이 나왔다. 통계량은 데이터의 특징을 하나의 숫자로 표현한 것이다. 구체적으로는, 평균값, 분산, 표준편차 등등이다. 도수분포표에서의 평균값의 역할 평균값 = .. 2019. 12. 21.