집단 간 비율비교, 교차분석(Crosstabs)
교차분석은 명목척도나 순서척도 변수인 두 개의 변수들 간의 연관성을 알아보기 위한 분석입니다.
X2 검정은 교차분석 후 집단 간 차이가 유의한지를 판단하는 것으로 교차분석과 별도로 분석하는 것이 아니라 교차분석을 진행하면서 카이스퀘어 검정에 대하여 분석을 추가로 실시하는 것이죠.
예를 들면
술을 좋아하는 것과 흡연이 어떤 상관이 있는가?
성별에 따라 정당에 대한 지지도가 다른가?
교차분석을 위해서는 대체적으로 10개 이내로 변수값의 개수가 작아야 해요.
교차표를 만들고자 할 때 두개의 변수가 명목척도 혹은 순서척도인 이유도 이러한 것인데,
구간, 비율척도라도 변수값의 갯수가 몇 개 안되거나 변수값을 코딩변경해서 순서 척도로 바꾸면 교차분석이 가능하답니다.
예를 들면
연령에 있어 원래 구간, 비율척도로써 갯수가 많겠지만,
1)20세미만 2)20세~39세 3)40세~59세 4)60세 이상의 그룹으로 코딩을 변경하면 순서척도가 됩니다.
그럼 교차분석을 실시해 보겠습니다.
예를 들어 다음과 같은 가설에 대하여 검증해 볼게요.
성별에 따라 정당 지지도에 차이가 있는가?
H : 성별에 따라 정당 지지 비율에는 유의한 차이가 있다.
SPSS에서 분석 - 기술통계량 - 교차분석
새창에서 종속변수 클릭 (정당지지도) - 행으로 이동 - 독립변수 클릭(성별) - 열로 이동
통계량 클릭 - 카이제곱 체크 - 람다체크 - 계속
셀 클릭 - 열(퍼센트) 클릭 - 확인
*분석시 람다체크를 했는데 두 변수 모두가 명목척도인 경우에는 람다를 체크하고, 두 변수 모두가 순서척도 이상인 경우에는 감마를 일반적으로 사용합니다.
카이스퀘어 통계량은 두 변수간 연관성이 있냐 없냐를 알 수 있고, 연관성이 얼마나 큰지는 알 수 없어요.
그래서 독립성 검정의 결과로써 연관성이 있다고 판단되면 연관성의 정도(람다, 감마)를 알기 위해서 실시하는 것입니다.
<카이제곱 검정> 결과표를 보면 카이제곱 값에 대한 유의확률은 .000이므로
성별에 따라 정당 지지도는 통계적으로 유의한 차이가 있다고 할 수 있습니다.
<정당 구분 * 성별 교차표>의 %를 비교해 보면
A정당은 여자(95.4%)가 높고, B정당은 남자(10.5%), C정당은 남자(28.7%)로 지지도가 높게 나타났습니다.
카이스퀘어 검정결과(p<.001)에 의해 성별에 따라 정당 지지도가 다르다고 할 수 있습니다.
<방향성 측도>를 보면 성별, 정당지지가 모무 명목척도라 연관성 정도는 람다 입니다.
정당 지지도를 모르는 상태 비해서 정당 지지도를 아는 상태에서 성별을 예측할 때 나타나는 예측오류 감소율(람다)는 .227입니다.
람다 값의 근사유의확률은 .010으로써 유의수준 .05보다 작기 때문에 연관성이 유의하다고 할 수 있어요.
그런데 카이스퀘어 검정 결과가 유의하지 않게 나온다면 난감하죠~~
이럴 경우 비슷한 유형끼리 묶어서 분석할 수 있습니다.
다른 변수로 코딩을 변경하는 것인데요,
예를 들면,
1)사무직 2)현장직 3) 영업직 4)주부 등등이 있을때 다룬변수 코딩변경으로 "직장인"으로 직업을 묶어버리는 거죠.
이처럼 표분 수가 비교적 적은 집단을 찾아서 비슷한 유형끼리 묶어주면 카이스퀘어 값이 유의하게 나올 수도 있습니다.
위 분석 데이터를 논문에 기재는 표는 다음과 같이 하시면 됩니다.
퀵데이터는 여러분의 성공을 위해 오늘도 함께 하겠습니다~~^^
(주)한국교육데이터
'논문' 카테고리의 다른 글
요인분석은 뭘까요?? 궁금증을 '퀵데이터'에서 해결해봐요~*^^* (0) | 2020.08.12 |
---|---|
'퀵데이터'에서 신뢰도분석 배워보기 (0) | 2020.08.12 |
독립표본t검정 '퀵데이터'에서 자세히 알아보아요^^ (0) | 2020.08.12 |
대응표본 t검정 '퀵데이터'에서 알아보기 (0) | 2020.08.12 |
일원분산분석이란 무엇일까요?_퀵데이터 (0) | 2020.08.12 |