배경
조사대상의 각 개체로부터 둘 또는 그 이상의 변수들을 동시에 관측하는 경우가 많다.
이 때에 "여러 개의 변수를 동시에 분석할 필요"가 있다.
분할표 (Contingency Table)
두 변수가 모두 범주형에 속하는 경우, 수집된 자료는 도수분포표 2차원으로 설명이 가능하다.
한 변수에 대한 범주는 왼쪽에, 다른 변수에 대한 범주는 오른쪽에 표시, 두 변수들이 교차하는 칸마다, 각 변수의 범주를 동시에 갖는 관측값들의 수를 그 칸의 도수로 기록하면 된다.
이를 분할표라고 한다.
ex) 정책에 대해 지지여부를 알아보기 위해 400명을 임의추출하여 조사. 개인의 성별과 지지여부를 해당 범주에 따라 정리한 결과이다.
여기는 성별, 지지 여부 가 두 가지의 변수이다.
찬성 | 미결정 | 반대 | 합계 | |
남자 | 112 | 36 | 28 | 176 |
여자 | 84 | 68 | 72 | 224 |
합계 | 196 | 104 | 100 | 400 |
상대도수로 바꾸면 다음과 같다.
찬성 | 미결정 | 반대 | 합계 | |
남자 | 0.28 | 0.09 | 0.07 | 0.44 |
여자 | 0.21 | 0.17 | 0.18 | 0.56 |
합계 | 0.49 | 0.26 | 0.25 | 1.00 |
다음은 성별을 기준으로 나눴을 때의 성별에 따라 지지여부를 상대도수로 분할한 것을 말한다.
찬성 | 미결정 | 반대 | 합계 | |
남자 | 0.636 | 0.205 | 0.159 | 1.000 |
여자 | 0.375 | 0.304 | 0.321 | 1.000 |
장점
두 가지 변수에 따라 분할표를 작성하기 때문에, 약의 효과를 알기위해, 정상집단, 투여집단 이렇게 나눌 때 용이하다.
두 집단을 비교하기 위해 쓰면 좋다.
'AI' 카테고리의 다른 글
Statistics : 4-4 : 두 변수의 자료 요약 : 수치를 통한 요약, 상관계수 (0) | 2020.01.01 |
---|---|
Statistics : 4-3 : 두 변수 자료의 요약 : 산점도 (0) | 2020.01.01 |
Statistics : 3-3 : 백분위수 및 사분위수, 변동계수 (0) | 2020.01.01 |
Statistics : 10-2 : 통계적 추정 : 점추정 (0) | 2019.12.26 |
Statistics : 9-3 : 중심극한정리 (0) | 2019.12.26 |
댓글