본문 바로가기
AI

Statistics : 회귀분석 : 선형관계의 강도

by 월곡동로봇팔 2020. 1. 14.

선형관계의 강도

 

선형관계의 강도를 보여주는 그래프

SST (Sum of Squares Total)

정의
> Syy = ∑yi - ybar)**2
y값들이 나타내는 변동의 크기를 SST라 하며, 총제곱합 (sum of squares total) 이라 한다.

SSR (Sum of Squares Regression)

> Sxy**2/Sxx
> 회귀제곱합이라고 하며, 이는 선형관계로 설명되는 변동이다.

R**2, 결정계수 (Coefficient of determination)

R**2 = SSR/SST = Sxy**2/SxxSyy = 1 - SSE/SST

결정계수는 항상 0~1 사이의 값임을 알 수 있다.

  • R**2 이 0에 가깝다면, 선형회귀모형이 관측결과를 설명하는데 별로 도움이 되지 않는 경우이다.
  • R**2 이 1에 가깝다면, 선형회귀모형이 관측결과를 설명하는데 잘 설명함을 알 수 있다.

cf ) 표본상관계수

r = Sxy / √(Sxx * Syy) 이다. 이는 R의 값이고, r이 1에 가까운 경우 산점도가 관측점들이 직선 주위에 가깝게 몰려있음을 알 수 있다.

산점도에 따른 표본상관계수

r=0인 산점도를 확인해보자.

 

세번째 산점도 같은 경우는, r=0이고 완전 무상관하게 산점도가 형성이 되어있다.

 

6번째 산점도 같은 경우는, r=0이다. 이 부분은 선이 형성되어있지만, 선형이 아니기 때문에, r=0으로 취급한다.

댓글