본문 바로가기

논문/연구,조사 분석방법

가설검증에서 유의한 차이가 있다는 것은 어느 정도의 차이일까?_퀵데이터

비교 차이 검증을 하는 연구에서 그룹 간 차이가 있는가 없는가는 가설검정에 의한 P값으로 판단합니다.

 

예를 들어 다음과 같은 연구 조사를 했다고 가정할게요.

 

목적 : 중국인은 미국인에 비해 코로나19에 감염되어 있는 비율이 높은지 여부 조사

방법 : 중국인 50명과 미국인 50명을 대상으로 코로나19의 감염 유무를 조사하고 가설검증은 Fisher`s exact test로 감염률을 비교하여 p<.05이면 유의한 차이가 있다고 판단

결과 : 코로나19 확진된 중국인 50명 중 32명(64%), 미국인 50명 중 18(36%)로 나타남(P<.001)

중국인이 코로나 19에 감염 되어 있는 확률은 미국인에 비해서 높다고 판단 할 수 있을까?

 

 

가설검정에서 p<.05로 유의한 차이가 있다는 조건하에서 결과가 P<.001로 나타나 통계적으로 유의한 차이가 있다고 할 수 있어요. 따라서 중국인은 미국인에 비해 코로나19에 감염되어 있는 확률이 높다고 할 수 있습니다.

 

이처럼 그룹간 차이가 있다라는 것을 알았다면 그 다음에 그룹 간 차이가 있다고 한다면 어느 정도 일까?를 알고 싶을 것입니다.

 

하지만 가설검정에서 그룹 간 차이의 크기는 산출할 수 없습니다.

 

가끔 논문에서

“P<.001으로 매우 큰 유의한 차이가 있다” 등의 표현을 쓰는데 이는 잘못된 것입니다.

 

P값은 귀무가설이 사실일 확률을 표현한 것입니다. 즉, 산출된 그룹 간 차이는 조건의 차이에 따른 것이 아니라 단지 개체의 차이인 것이다라는 확률을 표시하는 것입니다. 따라서 그룹 간에 어느 정도 차이가 있는가에 관해서는 추정할 수 없는 것이죠.

따라서 그룹 간에 어느 정도 차이가 있는가에 관해서는 추정할 수 없는 것이죠.

 

다시 한번 말하면

P값의 크기로 그룹 간의 차이의 크기를 판단하는 것은 불가능하다!!

 

 

(주)한국교육데이터

검증된 데이터 통계 분석 전문 기업, 퀵데이터와 함께 하세요!!