본문 바로가기

논문/논문통계

P 값의 'P'는 뭘 까요?? 퀵데이터에서 알아봐요^^

P 〈 0.05

통계에서 사용하는 기호하면 우리가 가장 많이 본 P 일 것입니다. 학술지나 논문을 읽다 보면 P가 나옵니다.

For example...

· 시험약 투약 후의 혈중 콜레스테롤 수치는 남녀 간의 유의차를 인정하지 않았다 (P=0.07).

· 약물 투여 후의 혈압 강하는 A 그룹이 B 그룹에 비해 유의하게 컸다 (P<0.05).

· A 그룹에서는 치료 전에 비해 혈당값(P, 0.0001) 및 뇨의 케톤 값(P<0.05)은 유의하게 낮아졌지만,

B 그룹에서는 혈당값(P<0.01)만이 낮아졌다. 뇨의 케톤 값(P<0.67) DMS 유의하게 내려가지 않았다.

여기서 P 값(P values)라 한다. 그럼 어떻게 해석되는 걸까??

P<0.05

비교한 데이터에 관해 그룹 간에 유의한 차이가 있다고 해석한다.

이 값의 해석 방법을 알고 있다면 통계 결과의 기본적인 해석은 할 수 있는 것입니다.

도대체 이 P 값은 어떤 값이며 기호나 숫자가 가지는 의미는 무엇일까요? 왜 0.05미만이 되면 유의차 있음이라 판다 하는 것일까요?

P 값 해석

우리는 통계를 통해 비교 검토하고 무엇을 알고 싶은 것일까요?

당연히 '비교하는 데이터에 차이가 있는지 없는지'에 대해 알아보려 하는 것입니다.

For example...

· 사례 1 : 2004년~2008년 직장인 평균수입은 5년 전에 비해 내려갔는지?

· 사례 2 : 견과류를 1주일 먹으면 혈중 콜레스테롤 수치가 내려가는지?

· 사례 3 : 신약 A는 기존 약 B보다 심박수를 정말로 강하게 감소시키는지?

{사례 1] 예를 들어, 2004년~2008년과 1999년~2003년 직장인 평균수입을 계산하면 다음과 같습니다.

직장인 평균수입

2004년~2008년

48,655,210원

1999년~2003년

50,669,380원

표를 보면 2004년~2008년의 평균수입은 1999년~2003년의 평균이 내려가 있습니다. 그럼 이 수치들로부터 "2004년~2008년의 직장인 평균수입은 그전의 5년 동안에 비해 정말로 내려간 것일까요?"라는 의문이 들것입니다. 이 내용을 보고 "사실이다"라고 판단해도 될까요?

답부터 말하자면 이 경우 "사실이다"라고 해도 무방합니다. 이 데이터가 국세청이 산출한 것으로 전국 모든 일반인 직장인의 수입을 조사한 것이라면 이 데이터를 그대로 받아들이면 됩니다.

이처럼 모든 사람으로부터 얻은 데이터를 해석할 경우, P 값 등이 나오는 통계 처리는 필요 없습니다.

[사례 2]는 어떨까요?

이 사례는 견과류를 먹으면 혈중 콜레스테롤 수치가 내려가는지 안 내려가는지 전 세계의 모든 사람들을 조사한 것이 아니라 일부분의 사람으로부터 얻은 결과입니다. 이 결과가 일반화될 수 있는지, 즉 우리에게 적용될 수 있는지를 알기 위해서는 통계가 필요했던 것이지요?

우선 8명의 데이터입니다.

혈중 콜레스테롤 수치

견과류

내려감

내려가지 않음

먹은 사람(4명)

3

1

먹지 않았던 사람(4명)

1

3

이 데이터에 t 검정(통계 검정 법)을 사용해 P 값을 계산해 보았습니다.

결과는...

P=0.23

P<0.05의 경우 [두 그룹 간에 유의한 차이가 있다]라 판단하기 때문에 비교 결과 [견과류를 먹으면 혈중 콜레스테롤 수치가 내려간다]라고 말할 수 없게 됩니다. 그럼 800명으로 데이터를 얻어 비교한 경우는 어떨까요?

혈중 콜레스테롤 수치

견과류

내려감

내려가지 않음

먹은 사람(400명)

300

100

먹지 않았던 사람(400명)

100

300

이 경우 P 값은 계산기로 계산할 수 없을 정도로 작은 값이 되었습니다. (P=0.00000000....) 물론 P<0.05이므로 [견과류를 먹으면 혈중 콜레스테롤 수치가 유의하게 내려간다]라고 해석해도 좋습니다.

80명, 32명, 16명으로부터 데이터를 얻은 경우 어떻게 되는지 알아볼까요?

80명 데이터...

혈중 콜레스테롤 수치

견과류

내려감

내려가지 않음

먹은 사람(40명)

30

10

먹지 않았던 사람(40명)

10

30

P=0.0000067

32명 데이터...

혈중 콜레스테롤 수치

견과류

내려감

내려가지 않음

먹은 사람(16명)

12

4

먹지 않았던 사람(16명)

4

300

P=0.0055

16명 데이터...

혈중 콜레스테롤 수치

견과류

내려감

내려가지 않음

먹은 사람(8명)

6

2

먹지 않았던 사람(8명)

2

6

P=0.06

의 결과를 얻었습니다.

32명

인 경우 → P<0.05

80명

800명

견과류를 먹은 사람들은 먹지 않은 사람과 비교해 보면 혈중 콜레스테롤 값이 유의하게 내려갔다.

라고 판단할 수 있습니다. 그러므로 이런 인원수를 대상으로 연구가 진행되었다고 하면, [나도 견과류를 먹으면 혈중 콜레스테롤 값이 내려갈지도 몰라~~]라고 믿어도 될지 모르겠습니다^^

한편 연구 대상자 수가 8명, 16명인 경우...

인 경우 → P ≥0.05

8명

16명

견과류를 먹은 사람들은 먹지 않은 사람과 비교해 보면 혈중 콜레스테롤 수치에 유의한 차이는 없었다.

판단할 수 있습니다. 8명 또는 16명 인원수가 적은 데이터를 통한 결과는 왠지 믿을 수 없다고 느끼는 것은 옳은 것이 됩니다.

마지막으로 [사례 3]의 구체적이 결과를 보겠습니다.

이 연구는 심근경색이 예전부터 있는 환자 40명을 대상으로 합니다. 40명을 두 그룹으로 나누어 그룹 1에는 신약 A, 그룹 2에는 기존 약 B를 투여해 투여 전과 3시간 후의 심박수를 측정했습니다.

약의 투여 전후 심박수의 평균값은 다음과 같습니다.

신약 A와 기존 약 B의 투여 전후의 평균 심박수 (박/분)

투여 전

투여 후

그룹 1:20명(신약 A)

72

42

그룹 2:20명(기존 약 B)

68

52

약의 투여 후 투여 전후의 차이를 계산해 보면...

신약 A와 기존 약 B의 투여 전후의 평균 심박수 (박/분)와 그 차이

투여 전

투여 후

차이

그룹 1:20명(신약 A)

72

42

30

그룹 2:20명(기존 약 B)

68

52

16

위의 표를 보면 신약 A의 심박수의 저하는 기존 약 B에 대해서 더 크다고 할 수 있습니다.

이 테이터에 P 값을 구하면...

P=0.04

P=0.04는 P<0.05이므로 신약 A는 기존 약 B에 비해서 유의하게 심박수를 줄이는 작용이 있다고 해석할 수 있습니다.

두 그룹에 심박수의 저하는 다음과 같습니다.

투여 전후의 심박수의 차이

신약 A

30박/분

기존 약 B

16박/분

이것을 보면 신약 A는 기존 약 B에 비해서 크게 심박수가 내려갔으므로 P 값을 구해야 할 필요성이 있는가를 생각하실지 모르겠습니다.

두 그룹 간에 심박수 저하의 차이(30 대 16)는 그냥 우연일 수 있습니다. 그것을 확인하기 위해서 만약에 두 그룹에 같은 약 A를 투여하면 어떻게 되는지 보겠습니다.

결과...

신약 A를 그룹 1과 그룹 2의 전원에 투여한 경우, 투여 전후의 평균 심박수(박/분)와 그 창이

투여 전

투여 후

차이

그룹 1:20명(신약 A)

71

43

28

그룹 2:20명(신약 A)

70

45

25

심박수 감소는 그룹 1에서 28박/분, 그룹 2에서 25박/분이 되었습니다. 동일한 약 A를 두 그룹에 투여해도 그룹 간의 심박수 감소에 차이가 나오고 있습니다. 이처럼 같은 조건에서도 두 그룹이 같은 결과가 될 경우는 거의 없습니다.

같은 조건이라도 그룹 간의 결과가 다른 이유는 간단합니다. 약을 투여하기 전부터 대상이 된 사람의 개체차에서 심박수가 다르고 약에 대한 대응도 개체차가 있기 때문입니다.

그러면 그룹 1과 그룹 2를 비교하면, 심박수의 감소가 더 큰 쪽은 정말 약의 효과에 의한 그룹 간의 차이인지 그렇지 않으면 약에 대한 개인 반응 차이(개체차)에 의한 우연의 차이인지 보기만 하는 것으로는 판단할 수 없게 됩니다. 이러한 차이를 판별해야 하는 필요가 있습니다.

이것을 가능하게 하는 것이 통계이며 그 결과와 P 값으로 표기됩니다.

이상 퀵데이터에서 P값 대해 알아보았습니다.

 

​(주)한국교육데이터

 

 

#퀵데이터 #P값#통계 #통계분석 #통계의중요성 #T검정 #통계검정법 #데이터분석 #통계자료 #논문컨설팅 #통계해석 #학위논문통계 #기업통계 #통계해설 #박사논문 #한국교육데이터