본문 바로가기

논문/연구,조사 분석방법

연구(조사)방법척도에 따라 달라지는 통계분석 알아보기_명목척도, 서열척도, 간격척도, 비율척도 구분_퀵데이터 배워봐요*^^*

 

자료수집은 모집단을 결정하고 표본을 선정한 후 그에 대한 속성을 파악하고자 합니다. 그리고 설문지, 관찰, 인터뷰 등을 통해서 수집 방법을 결정하고 측정하게 되죠.

 

연구에 있어 측정은 표본이 가지고 있는 속성의 값을 일정한 규칙으로 만들어진 도구(척도)를 이용하여 계량화(수치) 하는 것을 의미합니다. 척도는 관찰대상의 속성을 측정하여 그 값을 숫자로 나타내는 일종의 규칙을 말합니다.

 

척도로 측정된 값들이 갖는 의미와 특징에 따라 척도는 질적척도와 양적척도로 구분하고 크게 명목척도, 서열척도, 간격(등간)척도, 비율척도의 4가지로 구분됩니다.

 

질적변수
(비계량적)
질적척도
명목척도 관찰대상의 관심속성을 측정하여 그 값을 범주로 나타내고 모든 연산 등 수학함수 적용 불가능
eg)1.남 2.여, 1.제조업 2.서비스업....
x2독립성 검증, x2적합도 검증, 비모수통계, 간격 혹은 비율척도 측정한 자료와 혼합할 경우 회귀분석 및 상관관계 분석 가능, 판별분석 및 로지스틱 회귀분석(종속변수로 이용)
서열척도 관찰대상의 관심 속성을 측정하여 그 값을 순위로 나타내고 순서 정보만 있어 서열만 가능하고 모든 연산 등 수학함수 불가능
eg)1위, 2위, 3위..., 리커트척도
스피어먼 상관관계분석, 비모수통계
양적변수
(계량적)
양적척도
간격(등간)척도 관찰대상의 속성값을 상대적 크기로 나타내고 사칙연산 중 (+,-)만 가능
eg)온도, 리커트척도(사회과학에서 속성 구간 간의 차이가 모두 동일하다고 가정하여 간격척도로 활용됨)
차이 검증, 분산분석(종속변수), 회귀분석(독립, 종속변수), 상관관계분석, 요인분석, 판별분석(독립변수), 군집분석, 다차원척도법, 로지스틱회귀분석(독립), 공분산분석 및 다변량분산분석(종속변수)
비율척도 절대적 기준인 영점이 존재하고 모든 사칙연산(+,-,×,÷) 모두 가능하고 간격척도, 서열척도, 명목척도 등으로 변환하여 사용 가능
eg)길이, 무게, 거리 등 자연과학에서 사용, 경력, 나이, 규모 등 사회과학에서 사용
귀하의 몸무게는 몇 kg입니까?( kg), 귀하의 나이는?( 세)
간격척도와 동일하게 분석 모두 가능, 서열 혹은 명목척도로 전환하여 비모수 통계 사용 가능

4가지의 척도에 대하여 살펴보도록 하겠습니다.

 

명목척도(nominal scale)

관찰대상이 갖는 속성에 따라 관찰대상을 상호 배타적인 범주로 구분하는 것으로 대상을 단순히 범주로만 분류하기 위한 목적으로 숫자를 사용하는 척도를 말합니다.

 

예를 들어 토트넘의 손흥민 등번호가 7번이고, 바르셀로나의 메시 등번호가 10번인데 메시가 손흥민보다 3만큼 크다는 의미는 아니죠. 단순 번호일 뿐입니다. 1번 남자, 2번 여자라고 할 경우도 여자가 1만큼 크다는 의미가 아니고요. 따라서 수치로서의 양적 의미는 없고 대상을 구별하기 위한 기호에 불과한 것입니다.

따라서 명목척도로 수집된 데이터는 범주형 자료로 사칙연산이나 로그함수와 같은 수학함수의 적용이 불가능합니다.

서열척도(ordinal scale)

관찰대상이 가지고 있는 속성의 크기를 측정하여 크기 순서대로 대상의 순위를 나타내는 것으로 명목척도와 마찬가지로 대상을 서로 구분할 수 있을 뿐만 아니라 속성의 크기에 따라 대상의 순서를 정할 수 있습니다. 다만 단순히 상대적 순위만 구분하는 것이지 각 서열 간의 차이 정도를 측정하지는 않아요.

 

예를 들어 올림픽의 어떤 종목에서 한국이 금메달, 미국이 은메달, 일본이 동메달이라고 한다면 순위는 의미가 있지만 시간에 대한 간격 차이는 측정할 수가 없죠. 직장을 선택할 때 수익성, 안정성, 발전성, 장래성의 4가지 항목에 대하여 중요하게 생각하는 것에 순서를 말하라고 한 경우에도 마찬가지입니다.

 

회사 직원 인사평가에서 등급(A,B,C,D,E,F)을 서열철도로 측정할 수 있을 것인데 식별이 가능하므로 명목척도 데이터의 특성도 갖는 반면, A부터 F까지 뒤로 갈수록 등급이 낮아지므로 서열화할 수도 있습니다. 하지만 이런 서열 데이터로 실제 점수를 알 수는 없습니다. 그리고 A와 B의 등급차이가 B와 C의 등급차이와 동일하다고 할 수도 없습니다. 단지 직원들의 상대적 등급 순위만 알 수 있는 것이죠.

또한 서열척도는 A사 핸드폰 성능에 만족하신가요?라는 설문에서 1.매우 불만족 2.불만족 3.보통 4.약간 만족 5.매우 만족과 같은 리커트척도의 속성으로 답변을 받을 수 있습니다. 이럴 경우에도 매우 만족의 응답자가 약간 만족인 응답자에 비해 만족도가 더 높은 것은 알 수 있으나 이들의 만족도 수준을 구체적으로 계량화할 수 없습니다.

 

이렇게 서열척도는 서열 간의 차이, 간격에 대해 측정하지 않고 단지 대상들의 순서에 관한 정보만을 측정하는 데 이용합니다. 단순히 대상을 구분하는 정보의 명목척도가 가지고 있는 정보를 포함하여 순위 정보도 가지고 있는 것이죠.

간격(등간)척도(interval scale)

속성 크기에 따른 관찰대상의 서열뿐 아니라 대상들 간에 어느 정도 차이가 있는가에 대한 정보도 포함하고 있습니다. 관찰 대상들이 가지고 있는 속성의 상대적 크기를 측정하여 대상 간에 서로 비교할 수 있도록 하는 척도입니다.

 

간격척도를 이용하면 관심 대상이 가지고 있는 속성의 크기에 따른 서열뿐만 아니라 크기의 상대적인 차이도 측정할 수 있습니다. 속성 간 상대적 차이를 나타내는 수치의 더하기(+), 빼기(-)의 산술적 계산이 가능합니다. 또한 간격척도로 측정된 값들의 평균을 구하여 사용할 수도 있죠. 다만 속성의 절대적 크기는 측정할 수 없으므로 사칙연산 중에서 비율처럼 곱(×) 하거나 나누는(÷) 승제 계산은 불가능합니다.

 

예를 들어 섭씨 60도와 50도 간의 차이는 섭씨 40도와 30도 간의 차이와 동일한 10도 간격을 갖게 되는데 10도의 온도 차이는 본질적으로 동일합니다. 그러나 섭씨 60도가 섭씨 30도에 비해 두 배 뜨겁다고 할 수 없듯이 간격척도를 통해 어떤 속성이 상대적으로 얼마나 더 많고 큰가를 알 수 있을 뿐입니다.

 

간격척도를 이용하여 대상이 가지고 있는 속성의 크기를 측정하고자 할 경우에는 등간격을 표시하는 길이를 나타내는 그림을 제시하며 측정해야 합니다. 대표적인 것이 리커트 척도입니다.

 

리커트척도는 매우 만족과 약간 만족의 차이가 약간 만족과 보통, 보통과 불만족, 불만족과 매우 불만족 등 이들 간의 차이와 동일하다고 할 수 없으므로 엄격히 따지면 간격척도가 아니라고 할 수 있습니다. 그러나 사회과학에서 간격척도로 측정한 데이터가 가지고 있는 통계분석 방법의 유연성에 따라 이런 유형의 데이터를 속성 구간 간의 차이가 모두 동일하다고 가정하여 보통 간격척도로 측정된 데이터로 분석에 활용합니다.

 

서열척도에서 예를 든 리커트척도의 설문처럼 배달 앱 서비스에 대한 인식에 대하여 중요하다고 생각하십니까?라는 질문에 1. 매우 중요하지 않다 2.중요하지 않다 3.보통이다 4.중요하다 5.매우 중요하다와 같은 리커트 척도를 간격척도로도 이용한다는 것이죠.

 

간격척도는 연속형 자료이기 때문에 평균, 분산 등을 계산할 수 있고, 서열척도나 명목척도로 변화하여 사용 가능합니다.

 

 

비율척도(ratio scale)

절대적인 기준을 가지고 속성의 상대적 크기 비교는 물론 절대적 크기까지 측정할 수 있도록 비율의 개념이 추가된 척도입니다. 일반적으로 절대적 기준은 0으로 표시합니다.

 

예를 들어 운동을 할 때 아령의 무게가 10kg이라면 다른 것과 비교하지 않아도 무거운 아령으로 운동하는구나라고 생각할 수 있죠. 이는 절대적인 기준점인 0으로부터 그 크기를 판단할 수 있기 때문입니다.

 

또 다른 예로 경쟁기업의 연간 당기순이익을 비율척도로 이용하여 측정할 경우 4천만 원과 5천만 원 간의 순이익 차이는 6천만 원과 7천만 원 간의 소득 차이와 같을 뿐만 아니라 두 값 간의 비율의 계산도 가능하죠. 순이익 7천만 원인 기업은 4천만 원인 기업에 비해 175% 높다고 할 수 있어요.

 

길이, 무게, 거리, 각도 등과 같은 자연과학의 변수나 연령, 경력, 매출, 규모 등의 사회과학 등에서 사용하는 이러한 변수는 비율척도로 측정할 수 있는 데이터들입니다. 연령, 경력, 매출 등에 있어 0은 값이 없음을 분명하게 나타내죠.

 

비율척도로 측정된 값들은 서로 곱하거나 나누는 사칙연산이 모두 가능하고 평균, 분산 등을 계산하고 수학 함수의 적용이 가능합니다. 따라서 비율척도로 측정된 값들이 가장 많은 정보를 포함하죠. 비율척도는 간격척도, 서열척도, 명목척도 등으로 변환하여 사용 가능합니다.

 

설문을 기획하고 구성하는 단계에서 가장 중요한 것은 얻고자 하는 정보와 관련해서 적절한 척도를 만들어야 합니다. 그리고 어떤 분석방법을 이용할 것인지도 고려해야 하며, 특별한 이유가 없는 한 상위 척도로 질문을 만드는 것이 더욱 의미있고 안전한 분석을 할 수가 있습니다.

다음은 스마트폰 브랜드에 대한 선호도 측정을 4가지 척도로 예를 든 것입니다.

척도를 보시면 스마트폰 브랜드에 대한 선호도를 측정하기 위한 설문인데, 상위척도로 갈수록 많은 정보를 얻을 수 있습니다. 이때 만약 비율척도로 만 측정한다면 가장 선호하는 브랜드(명목), 선호 브랜드이 순서(서열), 브랜드에 대한 선호 정도(간격), 상대적 선호 정도(비율)을 모두 알 수 있는 것이죠.

앞에서 살펴 본 척도의 선택에 따라 분석방법도 틀려지니 4개의 척도에 대해서는 충분히 인지하고 있어야만 제대로 된 통계 분석 결과를 얻을 수 있을 것입니다.

기업 데이터 분석 통계, 공공기관 데이터 분석 통계, 연구 논문 데이터 분석 통계, 설문지 기획 구성!!!!

퀵데이터와 함께 하세요~~^^

 

(주)한국교육데이터