논문통계에서 사용되는 분산분석의 개념 및 종류에 대해서 알아보겠습니다.
#분산분석(Analysis of variance)이란? #분산분석가정 #분산분석의분류 #기업데이터분석 #통계분석 #퀵데이터
● 분산분석(Analysis of variance): 3개 이상의 집단 간 평균 차이를 분산값으로 검정
● 독립변수는 집단을 구분하는 범주형(명목, 서열), 종속변수는 연속형 변수(간격, 비율)로 구성
● 집단 간 평균들의 분산이 클수록 평균은 서로 다르기 때문에 집단 평균들의 분산으로 집단 간 평균들이 얼마나 다른가를 알 수 있음
● 집단 간 평균들의 분산과 집단 내 관측치들의 분산을 비교하여 집단 간 평균 차이 검증
● 여러 집단 간 평균이 다름을 집단 간 분산과 집단 내 분산을 비교하여 판단
평균이 서로 다름은 평균에서 멀리 떨어져 있는 정도이고 이것은 분산이 크다는 것을 의미한다. 집단 평균의 분산크기를 상대적으로 평가하기 위해 집단 내 분산, 평균제곱이 사용된다.
ex) 집단 4개인 경우 (A, B, C, D)
두 집단은 보통 t-test를 이용한다. 그럼 세 집단은 t-test로 분석이 안될까?
예를들어 A, B, C, D 네 집단을 비교한다고 해보자. 두 개의 집단으로 각 구분하여 6번을 검증해야 한다. 이보다 더 중요한 이유는 여러번 검정하는 것은 제1종 오류의 확률을 증가시킨다. 5%는 일부 평균들 간에 차이가 존재하지 않음에도 불구하고 차이가 존재한다고 결론지을 확률이 5%라는 의미다. 6번의 검증에서 한 개 이상의 제 1종 오류를 범할 확률은 약 40%가 된다는 의미이다.
● T-test는 AB, AC, AD, BC, BD, CD 각 6번을 검증(4C2 = 6)
● T-test는 제1종 오류 확률 증가(6번의 검증에서 1개 이상의 제1종 오류를 범할 확률은 약 40%)
=> n=6과 p=0.05인 이항분포를 이용(1-P(X=0)=1-0.5987=0.4013)
● 분산비(F) = (집단 간 평균제곱)/(집단 내 평균제곱)
● 분산비(F)가 커지면 분산이 크고, 집단간의 성질이 다르며, 집단의 효과가 큼
■ 분산분석의 가정
① 독립성: 표본들은 각 모집단들로부터 임의적, 독립적으로 추출
=> 표본을 추출된 각 집단에 속한 관측치는 무작위 추출하고 서로 독립적이어야 함
① 정규성: 표본들이 추출된 모집단은 정규분포를 이뤄야 함
② 등분산: 모집단 분산은 모두 동일해야 함
=> 독립변수(집단)의 개별 수준에 대응하는 모집단은 정규분포하고 동일한 분산을 가져야 함
=> 등분산 위배시 Welch ANOVA, Kruskal-Wallis test 이용
서로 독립적이라는 것이 관측치들간에 서로 연관성이 없어야 한다는 것이다. 예를 들어 같은 사람에게 서로 다른 3개의 실험을 해서 얻은 데이터로 집단 간 차이를 분석하면 안된다.
정규분포나 등분산 가정이 위반되었을 때, 로그 변환 등을 통해 분석하기도 한다. 그런데 분산분석은 정규성 가정은 크게 제한을 두지 않는다. 극단적으로 비정규성을 보이지 않는다면 크게 문제 되지 않는다. 그리고 등분산 역시 표본의 크기가 각 집단별로 유사하다면 크게 등분산 가정이 되지 않더라도 큰 문제는 없다.
■ 분산분석의 종류

종속변수의 수에 따라 단일, 다변량 분산분석으로 나뉜다.
단일변량분산분석은 단일 종속변수의 평균값이 집단 간에 차이가 있는가를 분석하는 것이고, 다변량분산분석은 2개 이상 종속변수들의 평균값들을 동시에 비교 분석하는 것이다. 집단을 구분하는 독립변수의 수에 따라 가장 많이 사용되는 일원, 이원 분산분석으로 구분한다.
보통 단일변량분산분석을 분산분석이라고 한다. 독립변수가 늘어날수록 종속변수를 구분하는 차원이 복잡해지고 분석 결과의 해석상 어려움이 많아 3개 이상의 독립변수를 사용하는 경우는 많지 않다. 분석분석은 넓은 의미로 보면 다변량분산분석, 공분산분석, 반복측정 분산분석을 포함한다.
분산분석의 개념이 궁금하다면 퀵데이터 논문통계 동영상으로 확인하기▶▶▶
"논문의 품질을 높이는 열쇠!!!
퀵데이터 논문통계분석을 통해 더욱 탄탄한 논문을 완성하세요."
퀵데이터 논문컨설팅은 논문 주제 선정부터, 연구모형, 통계분석, 심사 준비까지 전문 지도 박사님의 1:1 맞춤형 컨설팅 통해 효율적이고 빠른 논문작성을 도와드립니다. 논문 검토, 논문편집, 논문 통계분석까지 직접적인 컨설팅을 원한다면 퀵테이터에 문의하세요 상담문의 1600-7473

'논문 > 논문통계' 카테고리의 다른 글
[논문통계] 논문통계의 일원분산 분석 및 일원분산분석 해석, spss일원분산분석, 논문통계작성법 (0) | 2024.03.18 |
---|---|
[논문통계] 분산분석 2편_분산분석 계산방법_통계강의로 배우는 논문통계/퀵데이터 (0) | 2024.03.15 |
[논문통계] 3편. 확인적요인분석의 모델적합도 향상하는 방법_논문통계강의 (0) | 2024.01.18 |
[논문통계] 2편. 확인적요인분석을 이용한 타당도 검증_논문통계강의 (0) | 2024.01.17 |
[논문통계] 1편. 확인적요인분석 AMOS를 활용한 분석방법 및 해석_논문통계강의 (0) | 2024.01.16 |