논문통계
분석 및 해석 방법

#논문통계분석의 p-값이 유의한지 확인하라고 하는데 도대체 유의확률(p-value)는 무엇을 나타내며 어떻게 해석해야 하나요?
#논문 통계분석의 p값은 무엇을 나타내나요?
#귀무가설, 대립가설은 어떻게 구분하나요?
#유의확률(p-값) 해석방법이 궁금해요?

▣ 유의확률이란??
모집단의 특성을 알아보기 위한 경험적 연구에서는 표본에서 얻은 자료를 가지고 모집단에 대한 가설이 타당한지를 추론통계를 사용해서 확인하는 절차를 하는데 이것을 가설검정이라고 한다.
■ 가설검정
√ 통계 분석을 통한 가설검정은 귀무가설의 채택 또는 기각 여부를 결정
√ 가설검정을 위해 수집한 데이터를 토대로 검정통계량의 값에 대응하는 유의확률 (P값)의 크기를 유의수준(α)과 비교한 후 유의확률이 유의수준보다 작을 때 귀무가설을 기각하고 클 경우 귀무가설을 채택
√ 귀무가설(null hypothesis) _ 영가설(H0)
- 귀무(null)는 없다는 뜻으로, 차이가 없다 혹은 같다는 의미이고, 연구자의 주장과 반대되는 가설
- eg. A약과 B약의 효과는 차이가 없다.
√ 대립가설(alternate hypothesis) _ 연구가설(H1)
- 귀무가설을 반대하는 가설이며 연구자의 추론, 주장에 대한 설명
- eg. A약이 B약보다 효과가 좋다.
√ 달리 생각할 만한 설득력 있는 이유가 없는 한 현상적 차이는 무(0)라는 명제로 시작
√ 귀무가설(영가설, H0) : 증명하고자 하는 실험가설과 반대되는 입장
“증명되기 전까지는 효과도 없고 차이도 없다.”
√ 대립가설(연구가설, H1) : 귀무가설과 반대로 실험을 통해 규명하고자 하는 가설

예상하거나 새로 알아내고자 하는 명제를 대립가설로하고 대립가설에 반대되는 명제를 귀무가설로 설정한다. 귀무가설은 일반적으로 동일하다. 차이가 없다 등으로 표현된다.
예를 들어, 새로운 약의 효과를 입증하고자 한다면 “새로운 약은 효과가 없다”라는 귀무가설을 전제로 연구를 시작한다. 또는 스트레스가 많으면 우울이 증가함을 입증하고 한다면 “스트레스는 우울에 영향을 미치지 않는다”라는 귀무가설을 먼저 세운다.
■ 가설검정 방법
많은 통계분석방법에는 가설검정 방법을 통해 추측을 하는데 가설검정에 의한 추측은 아래와 같은 순서의 단계로 진행된다.
1. 가설 수립 (H0 : 귀무가설, H1 : 대립(연구)가설)
H0 : 두 변수는 상관이 없다. / H1 : 두 변수는 상관이 있다.
H0 : 새로운 약과 기존 약은 치료효과에 차이가 없다. / H1 : 새로운 약과 기존 약은 치료효과에 차이가 있다.
2. 데이터를 통한 검정통계량(t, x2, F 등) 계산
가설을 검정하기 위한 통계량 값이며 표본 자료값을 가지고 계산
3. 검정통계량 값의 P값(유의확률) 계산
귀무가설이 참일 경우, 검정통계량 값이 얼마나 빈번하게 일어날지에 대한 확률값
P값이 작으면 귀무가설 하에서 일반적 현상이 아니므로 귀무가설 기각하고 대립(연구가설)채택
유의수준(α)을 기준으로 하며, 1%, 5%, 10%를 사용하는데 5%가 가장 널리 사용
4. 결론: 유의확률(P값) < 유의수준(α) 이면 대립가설(H1)채택
가설검증 결과는 귀무가설의 기각된다와 기각되지 않는다 중 한 가지의 결론을 내려야 한다. P값이 작을수록 귀무가설을 확실히 기각한다면 어느 정도의 P값이 되어야 하는가가 중요한데 통계학자들은 기준치로 허용 유의확률, 즉 유의수준을 제시하였다. p값이 유의수준보다 작으면 귀무가설을 기각하는 결정을 내리는데 흔히 유의수준은 0.05로 정해지지만 0.1(10%)이 사용될 때도 있다. 물론 유의수준을 정하는 것은 주관적이지만 유의수준 0.1은 너무나 관대하므로 지도교수 혹은 학회 심사에서 거절될 수도 있다.
유의수준이 0.05(5%)라는 것은 표본의 결과가 모집단의 본질과 관계없이 표본의 특성에 의해 우연히 나타났을 확률이 100번 중 5번 이하라는 의미이다. 즉, 통계치가 모수치를 대표하는 정도에 있어 오차가 5%이고 표본 통계치의 신뢰도가 95%라는 것이다.
대립가설은 연구자가 세운 새로운 가설이다. 논문에서는 내가 주장하는 대립가설만 기술한다. 논문에서 가설이 채택되었다고 하는 것은 대립가설이 채택되었다는 것을 의미한다.

√ 통계적 검정에서 처음부터 차이가 있음을 입증하기 어려움
√ 차이가 없다고 가정(귀무가설)하고, 통계적 검정을 통해 차이가 있다는 근거를 충분히 확보하면 귀무가설 을 기각함으로써 연구자 주장(대립가설)을 받아들임
통계적 가설검정은 재판에 비유될 수 있다. 피고인이 범죄로 기소되면 무죄추정원칙으로 판결이 나기전까지 무죄로 가정하고 재판을 진행한다. 범죄사실이 없다는 변호사의 주장이 귀무가설이고 범죄사실이 있다는 검사의 주장이 대립가설이다. 판사는 유죄를 입증할 만한 충분한 증거가 없으면 무죄로 판결을 내린다. 무죄입증은 유죄 입증보다 어렵고 때로는 불가능하므로 무죄라는 가정(귀무가설)을 먼저 설정하고 이를 부정함으로써 무죄가 아니다(대립가설)라는 검사의 주장을 받아들인다.

√ 제1종 오류: 옳은 귀무가설이 기각될 때 발생(α, 유의수준)
- 재판에서 결백한 사람이 잘못하여 유죄로 선언될 때 발생
- 실제 치료효과가 없는데도 있다고 잘못 판단하는 것
√ 제2종 오류: 허위 귀무가설을 기각하지 않을 때 발생(β)
- 유죄인 피고가 무죄로 선언될 때 발생
- 실제 치료효과가 있는데도 효과를 증명하지 못하는 오류
√ 제1종 오류와 제2종 오류는 역의 관계인데, 어느 한 확률을 감소시키는 것은 다른 확률을 증가시킨다는 것을 의미

제1종 오류의 확률과 제2종 오류의 확률 간 관계
"한 사람의 결백한 사람을 유죄로 선언하는 것보다 100명의 유죄인 사람을 무죄로 선언하는 것이 더 낫다.”
제1종 오류의 확률은 제2종 오류 확률의 1/100이어야 한다.
제1종 오류가 더 중대한 오류이므로 이를 얼마나 허용할 것인가에 따라 통계적 유의성을 판정
제2종 오류의 경우, 예를 들면 신약 효과를 실험했는데 실제로 효과가 있는데 그 효과를 입증하지 못한 것이다. 이 경우 논문 발표도 어렵고 신약 효과가 인정을 받지 못했기 때문에 연구자 혼자만 아쉬워하면 된다. 그러나 제1종 오류의 경우 신약의 효과가 없는데 있다고 잘못 판단해서 사람들에게 투여가 된다면 사회적으로 큰 문제가 된다. 이런 이유로 제1종 오류를 가장 문제가 되는 오류로 받아들여서, 제1종 오류가 발생할 확률을 5% 미만으로 지킬 것을 학계가 권하고 있는 것이다. 통계검정 결과 p값이 유의수준 0.05 미만으로 나왔다고 가정하자. 이것은 실제로는 효과가 없는데 검정 결과 효과가 있다고 잘못 결론 낼 확률이 5%미만이라는 뜻이다. 즉, 제1종 오류를 범할 가능성을 5%미만으로 제한하겠다는 것인데 유의수준의 기준이 낮을수록 신뢰는 높아진다.

논문통계의 유의확률, 유의수준 1편. 동영상으로 알아보기▼▼▼
퀵데이터 논문컨설팅은 논문 주제 선정부터, 연구모형, 통계분석, 심사 준비까지 전문 지도 박사님의 1:1 맞춤형 컨설팅 통해 효율적이고 빠른 논문작성을 도와드립니다. 논문 검토, 논문편집, 논문 통계분석까지 직접적인 컨설팅을 원한다면 퀵테이터에 문의하세요 상담문의 1600-7473
"논문의 품질을 높이는 열쇠!!!
퀵데이터 논문통계분석을 통해 더욱 탄탄한 논문을 완성하세요."
홈페이지 : www.quickdata.co.kr 대표번호 : 1600-7473 e-mail : quickdata7@naver.com
