Statistics : 4-3 : 두 변수 자료의 요약 : 산점도
산점도 (Scatter Diagram) 정의 두 변수 x, y 간의 관계를 분석할 때, 중요한 첫 번째 단계가 자료에 대한 그림을 그리는 것이다. 변수 x를 수평축에 놓고 변수 y를 수직축에 놓은 후에 각 관측값의 짝을 좌표 위에 표시함으로써 얻게 되는 그림을 산점도 (Scatter Diagram) 이라고 한다. 산점도의 예시-1 위의 산점도를 보면, 노란색 부분이 한국이다. 한국과 수평하게 같은 라인에 있는 도시와 비교해보면, 한국은 1인당 보건비 지출액이 비슷한 나라 3개 국가 중에서, GDP 대비 보건의료비 지출비중이 높다고 할 수 있다. import matplotlib.pyplot as plt plt.scatter([6.6, 6.5, 12.7, 9.4, 8.7, 8.8, 6.1, 4.3, 1.9,..
2020. 1. 1.
Statistics : 3-2 : cf) 평균값과 표준편차를 이용한 데이터 분석
한 dataset 중에 있는 어떤 data가 갖는 의미 내 점수가 85점이라고 할 때, 위의 그림을 A 학급, B 학급이라고 하자. 만약 A 학급이라면, 표준편차가 B 학급보다는 작다. 따라서 내 점수는 평균에서 많이 멀어져 있고, 다른사람들도 평균에서 머물러있다는 뜻이므로, 내 점수는 가치가 높다. 만약 B 학급이라면, 표준편차가 A 학급보다는 크다. 따라서 점수 분포가 평균에서 다들 많이 떨어져있으므로, 고득점의 사람들도 A 학급보다는 많다는 의미이기 때문에, 내 점수의 가치는 낮다. 위의 그림처럼, dataset이 만약에 정규분포에 가깝다면??? 평균점수에서 표준편차만큼 높은 정도의 경우는 특수하다고 볼 수 없지만, 평균점수에서 표준편차보다 2, 3배만큼 큰 경우는 특수하다고 볼 수 있다. "특수하..
2019. 12. 21.