본문 바로가기
AI

Statistics : 4-2 : 두 변수 자료의 요약 : 분할표

by 월곡동로봇팔 2020. 1. 1.

배경 

조사대상의 각 개체로부터 둘 또는 그 이상의 변수들을 동시에 관측하는 경우가 많다.

이 때에 "여러 개의 변수를 동시에 분석할 필요"가 있다.

 

분할표 (Contingency Table)

두 변수가 모두 범주형에 속하는 경우, 수집된 자료는 도수분포표 2차원으로 설명이 가능하다.
한 변수에 대한 범주는 왼쪽에, 다른 변수에 대한 범주는 오른쪽에 표시, 두 변수들이 교차하는 칸마다, 각 변수의 범주를 동시에 갖는 관측값들의 수를 그 칸의 도수로 기록하면 된다.

이를 분할표라고 한다.

ex) 정책에 대해 지지여부를 알아보기 위해  400명을 임의추출하여 조사. 개인의 성별과 지지여부를 해당 범주에 따라 정리한 결과이다. 

 

여기는 성별, 지지 여부 가 두 가지의 변수이다.

 

  찬성 미결정 반대 합계
남자 112 36 28 176
여자 84 68 72 224
합계 196 104 100 400

상대도수로 바꾸면 다음과 같다.

  찬성 미결정 반대 합계
남자 0.28 0.09 0.07 0.44
여자 0.21 0.17 0.18 0.56
합계 0.49 0.26 0.25 1.00

 

다음은 성별을 기준으로 나눴을 때의 성별에 따라 지지여부를 상대도수로 분할한 것을 말한다.

  찬성 미결정 반대 합계
남자 0.636 0.205 0.159 1.000
여자 0.375 0.304 0.321 1.000

장점

두 가지 변수에 따라 분할표를 작성하기 때문에, 약의 효과를 알기위해, 정상집단, 투여집단 이렇게 나눌 때 용이하다.

두 집단을 비교하기 위해 쓰면 좋다.

댓글