본문 바로가기

논문자료/논문통계분석

통계분석"데이터 분석 초보 필독! 퍼센타일·사분위수 계산법과 실무 활용"

 

통계를 배우다 보면 반드시 만나게 되는 개념이 바로 퍼센타일과 사분위수입니다. 시험 성적을 받을 때 "상위 25%에 해당한다"거나 "50퍼센타일"이라는 말을 들어본 적이 있으실 텐데요, 이것이 바로 퍼센타일과 사분위수의 개념입니다.

실제로 개념과 계산 방법을 명확히 이해하지 못해 혼란을 겪는 경우가 많습니다. 이번 글에서는 퍼센타일과 사분위수의 정의, 계산 방법, 그리고 논문 분석에서의 활용까지 차근차근 정리해보겠습니다.

 

논문통계분석 및 해석 작성 ㅣ퀵데이터

 

퍼센타일이란?

퍼센타일(Percentile)은 전체 데이터를 크기순으로 나열했을 때, 특정 값보다 작거나 같은 데이터가 전체에서 차지하는 비율을 백분율로 나타낸 것입니다.

쉽게 말해, 데이터를 크기 순서대로 순서대로 나열해서 100등분하고 작은 쪽부터 어느 위치에 있는지를 나타내는 용어입니다. 퍼센타일은 상대적인 위치를 파악하는 데 매우 유용합니다.

통계분석_퍼센타일의 정의

 

퍼센타일의 핵심 포인트

  • 25퍼센타일: 전체 데이터 중에서 하위 25%에 해당하는 값
  • 50퍼센타일: 전체의 절반, 즉 중앙값(Median)과 같음
  • 75퍼센타일: 전체 데이터 중에서 하위 75%에 해당하는 값

만약 어떤 학생이 수학 시험에서 80퍼센타일에 해당한다면, 전체 학생 중 80%보다 높은 점수를 받았다는 의미입니다.

다른 예로 한 학생의 시험 점수가 85점이고, 이 점수가 70퍼센타일에 해당한다면, 전체 학생 중 70%는 85점 이하를 받았다는 의미입니다.

통계분석_퍼센타일 예시

 

사분위수란?

사분위수(Quartile)는 퍼센타일의 특별한 경우로, 전체 데이터를 4등분하는 값들을 말합니다.

제1사분위수(Q1): 25퍼센타일 = 25% 지점

제2사분위수(Q2): 50퍼센타일 = 중앙값 50% 지점

제3사분위수(Q3): 75퍼센타일 = 75% 지점

통계분석_사분위수 정의

 

퍼센타일 구하는 방법

데이터를 가지고 70퍼센타일을 구해보겠습니다.

21, 22, 33, 28, 50, 26, 24, 25, 35, 32

1단계: 데이터를 크기순으로 정렬(데이터를 오름차순으로 정렬)

순서
1번
2번
3번
4번
5번
6번
7번
8번
9번
10번
21
22
24
25
26
28
32
33
35
50

2단계: 70%의 순위를 구한다.

3단계: 70% 몇 번째인지를 구한다.

(데이터 수 + 1) × 70%의 순위 = (10 + 1) × 0.7 = 11 × 0.7 = 7.7(번째)

4단계: 보간법 적용

퍼센타일을 연속적 개념으로 표현하기 위해 보간법 적용을 하는데요. 데이터 개수는 10개, 20개처럼 정수인데, 퍼센타일 공식으로 계산하면 위치기 7.7과 같이 소수점이 나올 수 있어요. 그런데 데이터는 7번째값과 8번째 값만 있지 7.7번째 값은 없습니다. 그래서 두 값 사이에서 비율만큼 보간(interpolation)을 해서 실제 위치에 해당하는 값을 추정하는 겁니다.

7번째 값 = 32

8번째 값 = 33

7.7은 7번째와 8번째 값 사이에 위치합니다.

32+(33−32)×0.7 = 32+0.7 = 32.7

데이터에서 70퍼센타일 값은 32.7인데, 전체 데이터의 70%가 32.7 이하에 있다는 뜻입니다. 학생 점수라면, 32.7점은 하위 70%와 상위 30%를 가르는 점수선입니다. 즉, 70%의 학생들이 32.7점 이하이고, 30%의 학생들이 32.7점 초과를 받은 것이죠.

통계분석_퍼센타일 구하는 방법

 

논문과 실무에서의 활용

교육학/심리학 연구: 학생들의 성적 분포, 스트레스 수준 등 상대적 위치 파악

경영·경제 연구: 소득 분포, 소비 수준 분석

의학·보건 연구: BMI, 혈압, 수면시간 등 건강 지표 비교

특히, 사분위 범위(IQR = Q3 - Q1)는 데이터의 변동성을 파악하는 중요한 지표로 이상치 탐지에도 활용됩니다.

통계분석_논문과 실무에서 활용되는 퍼센타일

 

퍼센타일(Percentile): 100칸으로 나눈 정밀한 자

퍼센타일은 전체 데이터를 크기순으로 나열했을 때, 100개의 동일한 부분으로 나눈 위치값을 의미합니다. 예를 들어, 85퍼센타일은 하위 85%의 데이터가 위치하는 지점의 값을 말합니다. 1부터 99까지 아주 세밀하게 데이터의 상대적 위치를 표현할 수 있습니다.

사분위수(Quartile): 4개의 큰 구간으로 나눈 핵심 지표

사분위수는 이름 그대로 전체 데이터를 4개의 동일한 부분으로 나눌 때 사용되는 경계값들을 의미합니다. 데이터의 전체적인 분포와 중심 경향을 파악하는 데 주로 사용됩니다.

통계분석_퍼센타일, 사분위수

 

 

위의 내용 퀵데이터 유튜브 동영상으로 확인하세요 ▼▼▼

 

데이터는 숫자 그 자체보다, 그 안의 ‘이야기’를 읽는 능력이 중요합니다.

퍼센타일과 사분위수는 바로 그 이야기의 첫 문장입니다.

논문 분석이 어렵게 느껴진다면, 퀵데이터와 함께 데이터를 해석하는 법부터 시작해보세요.

논문통계분석, SPSS/AMOS 해석, 표작성까지 퀵데이터가 한 번에 해결해드립니다.

☎ 1600-7473