P 〈 0.05
통계에서 사용하는 기호하면 우리가 가장 많이 본 P 일 것입니다. 학술지나 논문을 읽다 보면 P가 나옵니다.
For example...
· 시험약 투약 후의 혈중 콜레스테롤 수치는 남녀 간의 유의차를 인정하지 않았다 (P=0.07). · 약물 투여 후의 혈압 강하는 A 그룹이 B 그룹에 비해 유의하게 컸다 (P<0.05). · A 그룹에서는 치료 전에 비해 혈당값(P, 0.0001) 및 뇨의 케톤 값(P<0.05)은 유의하게 낮아졌지만, B 그룹에서는 혈당값(P<0.01)만이 낮아졌다. 뇨의 케톤 값(P<0.67) DMS 유의하게 내려가지 않았다. |
여기서 P 값(P values)라 한다. 그럼 어떻게 해석되는 걸까??
P<0.05 비교한 데이터에 관해 그룹 간에 유의한 차이가 있다고 해석한다. |
이 값의 해석 방법을 알고 있다면 통계 결과의 기본적인 해석은 할 수 있는 것입니다.
도대체 이 P 값은 어떤 값이며 기호나 숫자가 가지는 의미는 무엇일까요? 왜 0.05미만이 되면 유의차 있음이라 판다 하는 것일까요?
P 값 해석
우리는 통계를 통해 비교 검토하고 무엇을 알고 싶은 것일까요?
당연히 '비교하는 데이터에 차이가 있는지 없는지'에 대해 알아보려 하는 것입니다.
For example...
· 사례 1 : 2004년~2008년 직장인 평균수입은 5년 전에 비해 내려갔는지? · 사례 2 : 견과류를 1주일 먹으면 혈중 콜레스테롤 수치가 내려가는지? · 사례 3 : 신약 A는 기존 약 B보다 심박수를 정말로 강하게 감소시키는지? |
{사례 1] 예를 들어, 2004년~2008년과 1999년~2003년 직장인 평균수입을 계산하면 다음과 같습니다.
|
직장인 평균수입 |
2004년~2008년 |
48,655,210원 |
1999년~2003년 |
50,669,380원 |
표를 보면 2004년~2008년의 평균수입은 1999년~2003년의 평균이 내려가 있습니다. 그럼 이 수치들로부터 "2004년~2008년의 직장인 평균수입은 그전의 5년 동안에 비해 정말로 내려간 것일까요?"라는 의문이 들것입니다. 이 내용을 보고 "사실이다"라고 판단해도 될까요?
답부터 말하자면 이 경우 "사실이다"라고 해도 무방합니다. 이 데이터가 국세청이 산출한 것으로 전국 모든 일반인 직장인의 수입을 조사한 것이라면 이 데이터를 그대로 받아들이면 됩니다.
이처럼 모든 사람으로부터 얻은 데이터를 해석할 경우, P 값 등이 나오는 통계 처리는 필요 없습니다.
[사례 2]는 어떨까요?
이 사례는 견과류를 먹으면 혈중 콜레스테롤 수치가 내려가는지 안 내려가는지 전 세계의 모든 사람들을 조사한 것이 아니라 일부분의 사람으로부터 얻은 결과입니다. 이 결과가 일반화될 수 있는지, 즉 우리에게 적용될 수 있는지를 알기 위해서는 통계가 필요했던 것이지요?
우선 8명의 데이터입니다.
|
혈중 콜레스테롤 수치 |
|
견과류 |
내려감 |
내려가지 않음 |
먹은 사람(4명) |
3 |
1 |
먹지 않았던 사람(4명) |
1 |
3 |
이 데이터에 t 검정(통계 검정 법)을 사용해 P 값을 계산해 보았습니다.
결과는...
P=0.23 |
P<0.05의 경우 [두 그룹 간에 유의한 차이가 있다]라 판단하기 때문에 비교 결과 [견과류를 먹으면 혈중 콜레스테롤 수치가 내려간다]라고 말할 수 없게 됩니다. 그럼 800명으로 데이터를 얻어 비교한 경우는 어떨까요?
|
혈중 콜레스테롤 수치 |
|
견과류 |
내려감 |
내려가지 않음 |
먹은 사람(400명) |
300 |
100 |
먹지 않았던 사람(400명) |
100 |
300 |
이 경우 P 값은 계산기로 계산할 수 없을 정도로 작은 값이 되었습니다. (P=0.00000000....) 물론 P<0.05이므로 [견과류를 먹으면 혈중 콜레스테롤 수치가 유의하게 내려간다]라고 해석해도 좋습니다.
80명, 32명, 16명으로부터 데이터를 얻은 경우 어떻게 되는지 알아볼까요?
80명 데이터...
|
혈중 콜레스테롤 수치 |
|
견과류 |
내려감 |
내려가지 않음 |
먹은 사람(40명) |
30 |
10 |
먹지 않았던 사람(40명) |
10 |
30 |
P=0.0000067 |
32명 데이터...
|
혈중 콜레스테롤 수치 |
|
견과류 |
내려감 |
내려가지 않음 |
먹은 사람(16명) |
12 |
4 |
먹지 않았던 사람(16명) |
4 |
300 |
P=0.0055 |
16명 데이터...
|
혈중 콜레스테롤 수치 |
|
견과류 |
내려감 |
내려가지 않음 |
먹은 사람(8명) |
6 |
2 |
먹지 않았던 사람(8명) |
2 |
6 |
P=0.06 |
의 결과를 얻었습니다.
32명 |
} 인 경우 → P<0.05 |
80명 |
|
800명 |
|
견과류를 먹은 사람들은 먹지 않은 사람과 비교해 보면 혈중 콜레스테롤 값이 유의하게 내려갔다. |
라고 판단할 수 있습니다. 그러므로 이런 인원수를 대상으로 연구가 진행되었다고 하면, [나도 견과류를 먹으면 혈중 콜레스테롤 값이 내려갈지도 몰라~~]라고 믿어도 될지 모르겠습니다^^
한편 연구 대상자 수가 8명, 16명인 경우...
|
} 인 경우 → P ≥0.05 |
8명 |
|
16명 |
|
견과류를 먹은 사람들은 먹지 않은 사람과 비교해 보면 혈중 콜레스테롤 수치에 유의한 차이는 없었다. |
판단할 수 있습니다. 8명 또는 16명 인원수가 적은 데이터를 통한 결과는 왠지 믿을 수 없다고 느끼는 것은 옳은 것이 됩니다.
마지막으로 [사례 3]의 구체적이 결과를 보겠습니다.
이 연구는 심근경색이 예전부터 있는 환자 40명을 대상으로 합니다. 40명을 두 그룹으로 나누어 그룹 1에는 신약 A, 그룹 2에는 기존 약 B를 투여해 투여 전과 3시간 후의 심박수를 측정했습니다.
약의 투여 전후 심박수의 평균값은 다음과 같습니다.
신약 A와 기존 약 B의 투여 전후의 평균 심박수 (박/분) |
||
|
투여 전 |
투여 후 |
그룹 1:20명(신약 A) |
72 |
42 |
그룹 2:20명(기존 약 B) |
68 |
52 |
약의 투여 후 투여 전후의 차이를 계산해 보면...
신약 A와 기존 약 B의 투여 전후의 평균 심박수 (박/분)와 그 차이 |
|||
|
투여 전 |
투여 후 |
차이 |
그룹 1:20명(신약 A) |
72 |
42 |
30 |
그룹 2:20명(기존 약 B) |
68 |
52 |
16 |
위의 표를 보면 신약 A의 심박수의 저하는 기존 약 B에 대해서 더 크다고 할 수 있습니다.
이 테이터에 P 값을 구하면...
P=0.04 |
P=0.04는 P<0.05이므로 신약 A는 기존 약 B에 비해서 유의하게 심박수를 줄이는 작용이 있다고 해석할 수 있습니다.
두 그룹에 심박수의 저하는 다음과 같습니다.
|
투여 전후의 심박수의 차이 |
신약 A |
30박/분 |
기존 약 B |
16박/분 |
이것을 보면 신약 A는 기존 약 B에 비해서 크게 심박수가 내려갔으므로 P 값을 구해야 할 필요성이 있는가를 생각하실지 모르겠습니다.
두 그룹 간에 심박수 저하의 차이(30 대 16)는 그냥 우연일 수 있습니다. 그것을 확인하기 위해서 만약에 두 그룹에 같은 약 A를 투여하면 어떻게 되는지 보겠습니다.
결과...
신약 A를 그룹 1과 그룹 2의 전원에 투여한 경우, 투여 전후의 평균 심박수(박/분)와 그 창이 |
|||
|
투여 전 |
투여 후 |
차이 |
그룹 1:20명(신약 A) |
71 |
43 |
28 |
그룹 2:20명(신약 A) |
70 |
45 |
25 |
심박수 감소는 그룹 1에서 28박/분, 그룹 2에서 25박/분이 되었습니다. 동일한 약 A를 두 그룹에 투여해도 그룹 간의 심박수 감소에 차이가 나오고 있습니다. 이처럼 같은 조건에서도 두 그룹이 같은 결과가 될 경우는 거의 없습니다.
같은 조건이라도 그룹 간의 결과가 다른 이유는 간단합니다. 약을 투여하기 전부터 대상이 된 사람의 개체차에서 심박수가 다르고 약에 대한 대응도 개체차가 있기 때문입니다.
그러면 그룹 1과 그룹 2를 비교하면, 심박수의 감소가 더 큰 쪽은 정말 약의 효과에 의한 그룹 간의 차이인지 그렇지 않으면 약에 대한 개인 반응 차이(개체차)에 의한 우연의 차이인지 보기만 하는 것으로는 판단할 수 없게 됩니다. 이러한 차이를 판별해야 하는 필요가 있습니다.
이것을 가능하게 하는 것이 통계이며 그 결과와 P 값으로 표기됩니다.
이상 퀵데이터에서 P값 대해 알아보았습니다.
(주)한국교육데이터
#퀵데이터 #P값#통계 #통계분석 #통계의중요성 #T검정 #통계검정법 #데이터분석 #통계자료 #논문컨설팅 #통계해석 #학위논문통계 #기업통계 #통계해설 #박사논문 #한국교육데이터
'논문 > 논문통계' 카테고리의 다른 글
통계는 판단 자료의 하나! 퀵데이터에서 허위상관에 대해 알아볼까요? (0) | 2020.09.23 |
---|---|
다변량 분석의 첫걸음_ 상관계수와 산포도_원인과 결과 퀵데이터에서 알아보기 (0) | 2020.08.19 |
통계는 왜 필요할까요???_퀵데이터 (0) | 2020.08.18 |
통계학의 척도! 데이터 분류 기준은 어떻게 할까요?_퀵데이터 (0) | 2020.08.18 |
표준정규분포, 우리 일상에 항상 함께 하는 통계학의 기본 정규분포 쉽게 알아보기_퀵데이터 (0) | 2020.08.18 |