본문 바로가기

논문/연구,조사 분석방법

가설검증과 신뢰구간의 밀접한 관계 알아보기_퀵데이터

그룹 간 차이 검증은 P값으로 판단할 수 있고, 어느 정도 차이가 있는가는 신뢰구간에서 판단할 수 있습니다.

 

가설검증과 신뢰구간에는 어떤 밀접한 관계가 있는가는 다음과 같습니다.

 

95% 신뢰구간이 0을 포함하지 않는 경우 : P<0.05

95% 신뢰구간이 0을 포함하는 경우 : P≥0.05

 

즉, 그룹 간의 비교에 대한 가설검정에서 P<.05일 경우에 그룹 간 차이에 대해서 95% 신뢰구간을 산출하면 0을 포함하지 않습니다. 반면 P>.05일 경우에 95%의 신뢰구간의 하한값은 마이너스(-), 상한값은 플러스(+)가 되는데 이는 95% 신뢰구간은 0을 포함한다는 것이죠.

 

예를 들어 보겠습니다.

 

고혈압이 있는 60명을 두 그룹으로 나누어 한 그룹에는 새로운 혈압약 A를 다른 그룹에는 기존 혈압약 B를 투여해서 혈압에 차이가 있는지를 검토한 결과 다음과 같다고 가정하겠습니다.

 

신약 A와 기존약 B의 투약 후의 수축기 혈압 검증 (평균값) (mmHg)

 

 

이 결과로부터 수축기 혈압의 강하(투여 전후의 차이)에 관해서 그룹 간에 유의차가 있는지를 알아보기 위한 가설 검증은 P<.05로 하겠습니다.

 

이것으로부터 “신약 A는 기존약 B에 비교해서 유의하게 큰 폭으로 혈압을 강하시켰다” 라고 판단할 수 있습니다.

 

만약 혈압이 10~28mmHg(95% 신뢰구간)이라고 가정 한다면

 

“신약 A는 기존약 B에 비하여 유의하게 크게 혈압을 저하시키고 그룹 간에 혈압 강하의 차이는 10~28mmHg이다” 라고 해석할 수 있습니다.

 

위 예의 가설검정 P<.05에서 신뢰구간은 0을 포함하지 않고 있습니다.

 

 

신뢰구간 구하는 방법 알아보기

https://blog.naver.com/quickdata7/222058458750

고객에게 적시배송을 위해 우리 회사는 얼마큼의 최적 재고를 가지고 있어야 할까?_ 신뢰구간 추정 알아보기_추정의 기본원리_퀵데이터

추정의 목적은 표본 통계량에 기초하여 모수의 근삿값을 결정하는 것입니다. 예를 들면 표본평균은 모평균...

blog.naver.com

 

다른 예를 들어 보겠습니다.

 

 

신약 A와 신약 C의 투약 전후의 수축기 혈압 검증 (평균값) (mmHg)

 

 

 

이 결과로부터 그룹 간에 유의차가 있는지를 알아보기 위한 가설 검증은 P≥.05로 하겠습니다. 이 결과는 “신약 A와 C 에서는 혈압의 강하에는 유의한 차이가 없다”라고 해석할 수 있습니다.

 

만약 혈압이 –6~18mmHg(95% 신뢰구간)이라고 가정 한다면

 

“신약 A는 신약 C에 비하여 혈압을 내리는 효능은 평균 18mmHg 정도 클 수 있고, 반대로 평균 6mmHg 작을 수도 있다” 라고 해석할 수 있습니다.

 

위 예는 가설검정 결과 유의한 차이가 없고(P>.05), 95% 신뢰구간은 0을 포함하고 있습니다.

 

 

따라서 그룹 간 유의한 차이가 있는지는 95% 신뢰구간을 산출해 보면 가설검증을 하지 않아도 판단할 수 있습니다.

 

즉, 95% 신뢰구간을 보는 것에 따라 그룹 간 유의한 차이가 있는지와 없는지, 차이가 있는 경우, 어느 정도의 차이가 있는지를 판단할 수 있게 됩니다.

 

 

조금 헷갈리시죠?

그래서 문제 하나를 준비했습니다. 잘 보고 판단해 보세요.

 

연구가설 : 신약 A가 기존약 B에 비해서 더욱 강하게 혈중 콜레스테롤 수치를 저하시킬 수 있는지를 검토

 

연구방법 : 혈중 콜레스테롤 수치가 높은 100명을 50명씩 두 그룹으로 나누어 한 그룹에는 신약 A, 다른 그룹에는 기존약 B를 투여한다. 혈중 콜레스테롤 값의 투여 전후를 측정해서 변화 과정을 비교한다. 분석은 Student`s t-test로 시행하고 p<.05로 유의한 차이가 있다고 판단한다.

 

연구결과 : 혈중 콜레스테롤 수치는 신약 A를 투여한 그룹에서 평균 60mg/dl이, 기존약 B를 투여한 그룹에서는 평균 25mg/dl 저하시켰다. 신약 A를 투여한 그룹은 기존약 B를 투여한 그룹에 비해 혈중 콜레스테롤 수치가 유의하게 크게 저하되었다(P<.001).

 

질문 : 두 그룹에서 혈중 콜레스테롤 수치 저하의 차이를 95% 신뢰구간에서 산출할 경우 얻을 수 있는 데이터는 무엇일까요?

① -38~12mg/dl ② -52~50mg/dl ③ 15~55mg/dl ④ 37~52mg/dl ⑤ 50~120mg/dl

 

정답은 3번입니다.

 

P<.001의 결과로 나타났기 때문에 두 그룹 간의 차이의 95% 신뢰구간은 0을 포함하지 않는 것으로 해석할 수 있습니다. 신약 A와 기존약 B 투여에 의한 혈중 콜레스테롤 수치 저하의 차이는 35mg/dl (60-25=35) 이므로 차이의 95% 신뢰구간은 35mg/dl을 포함하고 있는 것입니다. 보기 중에 35mg/dl을 포함하고 0mg/dl을 포함하지 않는 것은 3번 뿐이네요.

 

 

신뢰구간이 0을 포함하는지, 안하는지를 보는 것에 따라서 가설 검증을 하지 않아도 그룹 간에 유의한 차이가 있는가를 판정할 수 있습니다.

 

정리하면

1. 가설검정과 95% 신뢰구간에는 밀접한 관계가 있다.

2. 95% 신뢰구간으로부터 가설검정에 의한 유의차 판정을 추정할 수 있다.

3. 신뢰구간으로부터 유의한 차이를 추정하기 위해서 95% 신뢰구간이 0을 포함하고 있는지 아닌지를 확인한다. 하한값이 마이너스, 상한값이 플러스이면 0을 포함하고 있다고 판단한다.

4. 95% 신뢰구간이 0을 포함하지 않는 경우, 가설검정의 결과는 p<.05가 되므로 유의한 차이가 있다고 판단할 수 있다.

5. 95% 신뢰구간이 0을 포함하는 경우, 가설검정의 결과는 P≥.05가 되므로 유의한 차이가 없다고 판단할 수 있다.

 

(주)한국교육데이터