본문 바로가기

논문자료/논문통계분석

사전·사후 효과검증, 이게 진짜 핵심이다. 대응표본 t검정|논문통계·SPSS분석부터 결과작성까지

대응표본t검정_spss분석방법부터 결과작성까지

 

"이 다이어트, 정말 효과 있을까?"

"새로 도입한 교육 프로그램, 실제로 도움이 됐을까?"

우리는 일상에서 끊임없이 '전후 비교'의 순간을 마주합니다. 전후 비교를 과학적으로 분석하는 방법, 대응표본 T검정(Paired Samples T-test)의5가지 핵심 통찰을 쉽게 풀어보겠습니다.

 

대응표본 T검정이란?

대응표본 T검정은 동일한 대상을 두 번 측정했을 때, 두 측정값 사이에 통계적으로 유의미한 차이가 있는지를 검정하는 통계 기법입니다.

적합한 상황

  • 사전-사후 설계
  • 동일 대상이 두 가지 조건을 모두 경험하는 경우
  • 짝지어진 데이터 비교
  • 교차설계 실험

부적합한 상황

  • 서로 다른 두 그룹을 비교할 때(독립표본 T검정 사용)
  • 대응 관계가 없는 데이터
  • 세 개 이상의 조건을 비교할 때(반복측정 ANOVA 사용)

핵심 원리: 4단계

1단계: 차이값 계산 각 대상의 '후 - 전' 값 계산

2단계: 차이값의 평균 계산

3단계: t 통계량 계산 평균 차이를 표준오차로 나눔

 

4단계: p-값 확인 자유도(n-1)를 가진 t 분포에서 p-값을 계산하여 통계적 유의성을 판단

 

중요한 가정들

1. 정규성: 차이값들이 정규분포를 따라야 함(Shapiro-Wilk 검정으로 확인)

2. 독립성: 각 관측치는 서로 독립적이어야 함

3. 측정 수준: 종속변수는 연속형(interval/ratio) 척도여야 함

 

1. 두 집단 비교가 아니라, '같은 사람들의 변화' 추적하기

대응표본 T검정의 첫 번째 특징은 동일한 대상의 변화를 관찰한다는 점입니다.

 

[예시] 바이오벤처 D사가 개발한 다이어트 보조제 효과를 검증했습니다. 29명을 모집해 보조제 복용 전후의 체중을 측정했습니다.

 

spss 대응표본t검정 분석 순서

1. 사전 사후 차이(변화량)이 정규성 가정을 만족해야 하는지 검정

H0: 집단은 정규성을 만족한다.

H1: 집단은 정규성을 만족하지 않는다.

 

(필수) 분석 – 기술통계량 – 데이터탐색

※ 분석 결과에 따라 사전 사후 차이는 정규분포 가정을 만족하므로 대응표본 t검정 가능

정규성검정

분석 – 평균비교 – 대응표본 t검정

spss분석_대응표본t검정
대응표본t검정 통계량
대응표본t검정 결과
대응표본t검정 효과크기

 

[대응표분t검정 분석 결과해석]

다이어트 보조제 복용 후 참가자들의 평균 체중은 약 9.138kg 감소했으며, 이는 통계적으로 유의할 뿐 아니라, 효과크기(Cohen’s d = 1.988) 기준에서도 체중 감소 효과로 확인되었습니다(p<.001). D사의 다이어트 보조제는 체중 감량에 실질적으로 유의미한 영향을 미친 것으로 해석할 수 있습니다.

여기서 중요한 점은 '29명의 A그룹 vs 다른 29명의 B그룹'을 비교하는 게 아니라는 겁니다. 29명 전체가 어떻게 변했는지를 봅니다.

 

2. 핵심은 '변화량'이라는 하나의 숫자

대응표본 T검정은 변화의 순수한 효과를 분리해야 합니다. 사전 데이터와 사후 데이터라는 두 목록을 하나의 데이터셋, 즉 변화량으로 압축합니다.

변화량(Di)=사후 값(Xi, after)−사전 값(Xi, before)

개개인의 변화량(Di)에만 초점을 맞춤으로써, 원래 데이터에 내재되어 있던 개인차의 영향을 효과적으로 제거합니다. 즉, 마케팅 캠페인이든 교육 프로그램이든, 개입이 만들어낸 진정한 변화만을 선명하게 들여다볼 수 있게 되는 것입니다.

위 다이어트 사례에서:

  • 참가자 1번: 75.2kg → 72.8kg = -2.4kg
  • 참가자 2번: 68.5kg → 67.1kg = -1.4kg

이후 분석은 원래의 측정값이 아닌, 변화량 데이터만을 가지고 진행됩니다.

 

3. '통계적 유의성' ≠ '실제로 중요함'

[예시] 한 온라인 쇼핑몰이 메인 페이지 디자인 개편 효과를 테스트했습니다. 8개 제품 카테고리에서 4주간 실험을 진행했습니다.

연구 설계

  • 1~2주차: 8개 카테고리 모두 기존 디자인 사용
  • 3~4주차: 동일한 8개 카테고리에서 새 디자인 적용
  • 측정: 각 카테고리의 전환율(%)

 

분석 결과

  • 평균 전환율: 3.28% → 3.66%
  • 차이: +0.38%p
  • t(7) = 2.54
  • p-값: 0.039 (통계적으로 유의미)

 

그런데 잠깐!

겉보기에 성공적인 결과입니다. 하지만 비즈니스 관점에서 생각해 볼게요.

비용-편익 분석

  • 디자인 전면 개편 비용: 3,000만원
  • 월 방문자: 1,000,000명
  • 전환율 0.38%p 상승 = 3,800명 추가 구매
  • 평균 주문액: 50,000원
  • 월 추가 매출: 1억 9천만원
  • 투자 회수 기간: 약 5일

이 경우는 개편할 가치가 충분합니다!

하지만 만약!!

  • 월 방문자가 10,000명이라면? → 월 추가 매출 190만원
  • 투자 회수 기간: 16개월

같은 p-값(0.039)이지만, 실질적 의미는 완전히 다릅니다.

▶여기서 얻는 교훈은 통계는 "차이가 존재한다"는 신호를 보냈지만, "그 차이가 행동을 바꿀 만큼 큰가?"라는 질문에는 답해주지 않습니다. 통계적 유의성과 실질적 중요성을 모두 고려해야 합니다!

 

4. 때로는 '차이가 없다'는 결론이 중요할 수 있습니다.

많은 사람들이 통계 분석을 할 때 '유의미한 차이가 있다'는 결과를 기대합니다. 하지만 '유의미한 차이가 없다'는 결론 역시 매우 가치 있는 과학적 발견입니다.

 

예를 들어보겠습니다.

두 종류의 진통제(A, B)가 만성 통증 환자의 수면 시간에 미치는 영향을 비교했습니다.

 

연구 설계

  • 대상: 6명의 만성 요통 환자
  • 설계: 교차설계(Crossover design)

1주차: 진통제 A 복용 → 수면시간 측정

2주차: 휴약기

3주차: 진통제 B 복용 → 수면시간 측정

 

분석 결과

  • 평균 차이: +0.28시간(B가 약간 더 높음)
  • t(5) = 1.13
  • p값: 0.319(0.05보다 훨씬 큼)
  • 결론: 두 진통제 간 유의미한 차이를 발견하지 못함

 

이게 실패일까요? 아닙니다!

결과가 말해주는 것

1. 통계적 검정력(Power) 부족

  • 표본이 너무 작아서(n=6) 실제 효과를 감지하기 어려웠을 수 있음
  • 더 많은 참가자(최소 20~30명)로 추가 연구 필요

2. 효과 크기가 작을 수 있음

  • 0.28시간(약 17분) 차이는 실제로 작은 효과일 수 있음
  • 임상적으로 의미 있는 차이(예: 1시간 이상)가 아닐 수 있음

3. 현 단계에서의 의사결정

  • "B가 A보다 낫다"고 주장할 근거 부족
  • 섣부른 약물 교체를 막는 안전장치 역할

만약 진통제 B가 A보다 5배 비싸다면?

이 결과는 "비싼 약으로 바꿀 필요 없다"는 매우 중요한 의사결정 근거가 됩니다.

"효과가 없다"는 증거가 아니라, "효과를 입증할 증거가 부족하다"는 고백인 것입니다.

 

5. 보이지 않는 규칙: 모든 분석에는 '가정'이 필요합니다.

분석 결과의 신뢰도를 보장하기 위해서는 반드시 지켜야 할 몇 가지 '기본 규칙(가정)'이 존재합니다.

 

대응표본 T검정의 핵심 가정

1. 정규성(Normality)

"차이값들이 정규분포(좌우 대칭의 종 모양)를 따른다"

왜 중요할까요? T검정은 정규분포를 가정하고 확률을 계산하기 때문입니다. 데이터가 이 모양에서 크게 벗어나면 결과가 부정확해질 수 있습니다.

확인 방법: Shapiro-Wilk 검정

만약 정규성을 위배한다면?

  • 표본이 크면(n ≥ 30): 중심극한정리에 의해 큰 문제 없음
  • 표본이 작으면(n < 30): Wilcoxon signed-rank 검정 사용 고려

2.독립성(Independence)

"각 관측치는 서로 독립적이어야 함"

즉, 한 사람의 결과가 다른 사람의 결과에 영향을 주면 안 됩니다.

위배 사례

  • 같은 가족 구성원을 여러 명 포함
  • 같은 병실에 있는 환자들(서로 영향을 줄 수 있음)

3.측정 수준(Measurement Level)

"종속변수는 연속형(interval/ratio) 척도여야 함"

적합: 체중(kg) / 점수(0-100점) / 수면시간(시간) / 혈압(mmHg) / 리커트척도

부적합: 범주형 데이터(예: 만족/불만족) / 순위 데이터(예: 1위, 2위, 3위)

 

자주 하는 실수들

1. 독립표본을 대응표본으로 분석

"A 다이어트를 한 20명과 B 다이어트를 한 20명의 체중 감량을 대응표본 T검정으로 비교"

→ 이것은 독립표본 T검정을 써야 합니다! 서로 다른 사람들이기 때문이죠.

2. 표본이 너무 작은데 일반화

"3명을 대상으로 테스트했는데 p=0.04가 나왔어요.

모든 사람에게 효과가 있다고 봐도 되죠?"

안 됩니다! 표본이 너무 작으면 우연한 결과일 가능성이 높고, 신뢰구간이 매우 넓고, 최소 10~15명 이상 권장합니다.

3. 정규성 가정을 무시

데이터가 심하게 치우쳐 있거나 이상치가 많은데도 T검정 실행

→ 이럴 때는 비모수 검정(Wilcoxon signed-rank test) 사용 또는 이상치 제거 후 재분석 또는 변수 변환(예: 로그 변환)

4. p-값만 보고 효과 크기 무시

"p < .001이니까 엄청난 효과네요!"

→ 아닙니다! p-값은 표본 크기의 영향을 받습니다.

표본이 매우 크면 작은 차이도 유의미하게 나올 수 있고, 평균 차이, 95% 신뢰구간, Cohen's d 등 효과 크기도 함께 확인해야 합니다.

5. 일방향/양방향 검정 혼동

  • 일방향 검정(One-tailed)

"교육 후 점수가 향상될 것이다" (방향 명시_한쪽 꼬리만 검정)

  • 양방향 검정(Two-tailed)

"교육 전후 점수가 다를 것이다" (방향 미명시_양쪽 꼬리 모두 검정)

→ 일반적으로 양방향 검정이 더 보수적이고 안전합니다!

6. 다중 비교 문제 무시

"10개 변수로 각각 T검정을 했더니 그 중 하나에서 p=.03이 나왔어요!"

→ 10번 검정하면 우연히 유의한 결과가 나올 확률이 높아집니다.

본페로니 교정(Bonferroni correction) 사용(α = 0.05/10 = 0.005) 또는 다변량 분산분석(MANOVA) 사용을 해야 합니다.

★ 대응표본 T검정 요약

1. 동일 대상의 전후 변화를 추적하는 분석 방법

2. 변화량(차이값)에만 집중하여 순수 효과 측정

3. 통계적 유의성 ≠ 실질적 중요성 - 둘 다 확인 필요

4. “차이 없음"도 중요한 과학적 발견

5. 정규성, 독립성 등 가정 충족 여부 반드시 확인


대응표본t검정 분석방법 및 유의사항 동영상으로 확인하기▼▼▼

대응표본 t검정 분석방법 및 주의점 논문통계강의로 확인하세요

 

대응표본 t검정은 하나의 집단에서 사전·사후 변화를 검증할 때 사용하는 핵심 분석입니다. 프로그램 참여 전후, 교육 효과, 치료 전후 변화 등 연구 현장에서 가장 자주 활용되며, 논문에서는 단순한 차이검증을 넘어 효과크기와 신뢰구간까지 함께 제시해야 완성도 높은 결과가 됩니다.

하지만 실제 논문 통계 과정에서는 정규성 검정, p값 해석, 효과크기 계산 등 세부적인 분석 단계에서 많은 대학원생이 어려움을 겪습니다.

 

이럴 때 퀵데이터(QuickData)의 논문통계대행 서비스를 이용하면 다음과 같은 장점이 있습니다.

  • 연구 목적에 맞는 분석 설계부터 결과 작성까지 일괄 지원
  • SPSS 및 amos 기반의 정확한 통계 검증과 결과표 작성
  • 빠른 피드백과 수정 대응으로 시간 절약 및 완성도 향상

논문통계 상담 지금 신청하세요

 

 

논문 통계는 단순한 계산이 아니라 ‘연구의 논리’를 완성하는 과정입니다.

퀵데이터(QuickData) 와 함께라면, 복잡한 분석도 명확한 결과로 바꿀 수 있습니다. ☎1600-7473