선형관계의 강도
SST (Sum of Squares Total)
정의
> Syy = ∑yi - ybar)**2
> y값들이 나타내는 변동의 크기를 SST라 하며, 총제곱합 (sum of squares total) 이라 한다.
SSR (Sum of Squares Regression)
> Sxy**2/Sxx
> 회귀제곱합이라고 하며, 이는 선형관계로 설명되는 변동이다.
R**2, 결정계수 (Coefficient of determination)
R**2 = SSR/SST = Sxy**2/SxxSyy = 1 - SSE/SST
결정계수는 항상 0~1 사이의 값임을 알 수 있다.
- R**2 이 0에 가깝다면, 선형회귀모형이 관측결과를 설명하는데 별로 도움이 되지 않는 경우이다.
- R**2 이 1에 가깝다면, 선형회귀모형이 관측결과를 설명하는데 잘 설명함을 알 수 있다.
cf ) 표본상관계수
r = Sxy / √(Sxx * Syy) 이다. 이는 R의 값이고, r이 1에 가까운 경우 산점도가 관측점들이 직선 주위에 가깝게 몰려있음을 알 수 있다.
r=0인 산점도를 확인해보자.
세번째 산점도 같은 경우는, r=0이고 완전 무상관하게 산점도가 형성이 되어있다.
6번째 산점도 같은 경우는, r=0이다. 이 부분은 선이 형성되어있지만, 선형이 아니기 때문에, r=0으로 취급한다.
'AI' 카테고리의 다른 글
Statistics : 7-7 : 기하분포 (0) | 2020.01.16 |
---|---|
Statistics : 선형회귀 : 잔차의 검토 (0) | 2020.01.14 |
Statistics : 회귀분석 : 모형, 최소제곱법을 이용한 모수 추정 (0) | 2020.01.13 |
Statistics : 정규모집단에서의 추론 : t 분포 (0) | 2020.01.11 |
Statistics : 10-4 : 모비율에 대한 추론 (표본의 크기가 클 때) (0) | 2020.01.11 |
댓글