본문 바로가기

논문자료/논문통계분석

데이터가 흩어진 정도 표준편차, 데이터 분석 기본기! 표준편차로 자료 분산 이해하기

“평균은 같지만 데이터의 퍼짐 정도가 다를 수 있다?”

통계 분석을 하다 보면 숫자들의 평균뿐 아니라, 얼마나 흩어져 있는지(산포)도 중요한 해석 포인트가 됩니다.

이때 사용하는 대표적인 지표가 바로 표준편차(Standard Deviation)입니다. 표준편차는 데이터가 평균값을 기준으로 얼마나 떨어져 있는지를 수치로 보여주는 지표로, 데이터의 일관성, 안정성, 분산 정도를 파악하는 데 필수적인 통계 개념입니다.

특히 설문 분석, 논문 통계분석, SPSS 결과 해석 등 다양한 분석에서 표준편차는 빠질 수 없는 기본 지표입니다.

논문통계분석 대행 ㅣ퀵데이터

 

통계학은 데이터 값이 얼마나 흩어져 있는가에 주목

 

일상적으로 통계와 관련하여 데이터 값의 중심(평균값, 중앙값, 최빈값 등)으로 생각하는데,

통계학에서는 데이터가 얼마나 흩어져 있는지에 주목해야 합니다.

데이터 값이 평균값 주변에 어떤 식으로 분포되고 또 떨어져 있는가를 알아내기 위한 것으로 통계학에서는 매우 중요합니다.

 

중심을 나타내는 지표를 대표값, 흩어진 정도를 나타내는 지표를 산포도라 합니다.

대표값이 여러 개였던 것처럼 산포도 역시 여러 가지 지표를 가지고 있습니다.

그중에서 먼저 표준편차부터 알아보겠습니다.

 

다음과 같이 예를 들어볼게요.

 

A(10) 점수

2,3,3,4,4,5,7,7,7,8

평균값 = 50÷10 = 5

 

B(10) 점수

3,4,4,5,5,5,6,6,6,6

평균값 = 50÷10 = 5

 

위 데이터를 보면 A, B팀 모두 평균값은 5입니다.

그러나 A팀은 평균보다 높거나 낮은 점수가 많고 B팀은 평균에 가까운 점수가 많죠?

이럴 때 흩어진 정도를 나타내는 지표(산포도) 중 하나인 표준편차를 구하는 것입니다.

 

*평균값(mean)은 μ(뮤)라는 기호를 사용합니다.

*표준편차(standard deviation)는 σ라는 기호를 사용합니다.

 


그럼 위 데이터를 가지고 표준편차 사용방법을 알아볼게요.

 

1) 평균값에서 어느 정도 떨어져 있는가를 나타낸다.

 

A팀 데이터는 평균값 μ=5, 표준편차 σ=2점을 사용해 나타낼 수 있어요.

A팀 2 3 3 4 4 5 7 7 7 8
  μA - σA


μA μA + σA  

데이터가 흩어진 정도는 평균값에 대해 표준편차 몇 개만큼 떨어져 있는가로 말할 수 있습니다.

예를 들어 7점은 평균값(μA=5)에 대해 표준편차(σA=2) 1개가 높다고 할 수 있어요.

이것을 μA + σA 로 표기하고, 마찬가지로 3점은 표준편차 1개보다 낮다고 생각해 μA - σA 로 표기합니다.

 

2) 표준점수를 구한다.

 

위에서 보듯이 8점은 평균값에 대해 표준편차 몇 개가 떨어져 있을까요?

먼저 데이터(점수)에서 평균값을 빼고(몇 점 떨어져 있는가), 그다음 표준편차로 나누면 구할수 있습니다.

 

(데이터 - μA) ÷ σA = (8-5)÷2 = 1.5

 

8점은 평균에서 표준편차 1.5개만큼 높다는 것을 알 수 있습니다.

이처럼 데이터에서 평균값을 빼고 표준편차로 나눠서 구한 값을 표준점수(Z점수)라고 합니다.

 

 

3) 편차값을 구할 수 있다.

 

편차값은 평균값을 50으로 하고 어떤 평균값보다 올라가고 내려가는지를 나타내는 지표입니다.

표준점수를 사용해 계산할 수 있습니다.

 

편차값 = 50+(표준점수)×10

 

A 8점은 표준점수가 1.5였기 때문에 편차값은 50+1.5x10 = 65가 됩니다.

 

위 예를 정리하면 다음 표와 같이 됩니다.

A팀 μA = 5 , σA = 2

점수 2 3 3 4 4 5 7 7 7 8
기호 μA - 1.5σA μA - σA μA - 0.5σA μA μA + σA μA + 1.5σA
표준점수 -1.5 -1 -0.5 0 1 1.5
편차값 35 40 45 50 60 65

 

 

B팀 μB = 5 , σB = 2

점수 3 4 4 5 5 5 6 6 6 6
기호 μB - 2σB μB - σB μB μB + σB
표준점수 -2 -1 0 1
편차값 30 40 50 60

 

표준편차가 나타내는 데이터가 평균값에서 어느 정도 떨어져 있는가를 보여주는 지표가

평균값이 같은 두 데이터를 비교하는데 도움이 됩니다.

 

기업에서 분기별 인사평가 점수로 예를 들어 볼게요.

A팀인 홍길동 사원의 상반기 인사평가 데이터입니다.

 

인사평가 1월 4월
평균값 50점 50점
표준편차 20점 10점
홍길동 사원 점수 70점 70점

 

1월 인사평가에서 홍길동 사원의 표준점수와 편차값

 

4월 인사평가에서 홍길동 사원의 표준점수와 편차값을 구하면 표준점수는 2, 편차값은 70입니다.

따라서 4월의 점수가 높아 인사평가 결과가 더 우수하다는 것을 알 수 있습니다.

 

표준편차 구하는 방법 알아보기

https://blog.naver.com/quickdata7/221972345155

 

 

퀵데이터는 여러분의 성공을 위해 오늘도 함께 하겠습니다~~^^

퀵데이터에서 제공하는 논문 통계 대행 서비스

✔ 논문주제 및 연구모형 설계 자문

✔ 논문설문 설계 및 데이터 정리

✔ 논문통계 분석 및 해석 결과 제공

✔ 논문 작성 및 첨삭, 완성도 향상

✔ 학술지 논문 제출용 포맷 지원까지

논문통계분석, 퀵데이터와 함께라면 전략이 됩니다. ☎ 1600-7473