가설검증에서 유의한 차이가 있다는 것은 어느 정도의 차이일까?_퀵데이터

비교 차이 검증을 하는 연구에서 그룹 간 차이가 있는가 없는가는 가설검정에 의한 P값으로 판단합니다.
예를 들어 다음과 같은 연구 조사를 했다고 가정할게요.

목적 : 중국인은 미국인에 비해 코로나19에 감염되어 있는 비율이 높은지 여부 조사
방법 : 중국인 50명과 미국인 50명을 대상으로 코로나19의 감염 유무를 조사하고 가설검증은 Fisher`s exact test로 감염률을 비교하여 p<.05이면 유의한 차이가 있다고 판단
결과 : 코로나19 확진된 중국인 50명 중 32명(64%), 미국인 50명 중 18(36%)로 나타남(P<.001)
중국인이 코로나 19에 감염 되어 있는 확률은 미국인에 비해서 높다고 판단 할 수 있을까?
가설검정에서 p<.05로 유의한 차이가 있다는 조건하에서 결과가 P<.001로 나타나 통계적으로 유의한 차이가 있다고 할 수 있어요. 따라서 중국인은 미국인에 비해 코로나19에 감염되어 있는 확률이 높다고 할 수 있습니다.
이처럼 그룹간 차이가 있다라는 것을 알았다면 그 다음에 그룹 간 차이가 있다고 한다면 어느 정도 일까?를 알고 싶을 것입니다.
하지만 가설검정에서 그룹 간 차이의 크기는 산출할 수 없습니다.
가끔 논문에서
“P<.001으로 매우 큰 유의한 차이가 있다” 등의 표현을 쓰는데 이는 잘못된 것입니다.
P값은 귀무가설이 사실일 확률을 표현한 것입니다. 즉, 산출된 그룹 간 차이는 조건의 차이에 따른 것이 아니라 단지 개체의 차이인 것이다라는 확률을 표시하는 것입니다. 따라서 그룹 간에 어느 정도 차이가 있는가에 관해서는 추정할 수 없는 것이죠.

따라서 그룹 간에 어느 정도 차이가 있는가에 관해서는 추정할 수 없는 것이죠.
다시 한번 말하면
P값의 크기로 그룹 간의 차이의 크기를 판단하는 것은 불가능하다!!
검증된 데이터 통계 분석 전문 기업, 퀵데이터와 함께 하세요!!


