본문 바로가기

논문

(161)
통계학의 척도! 데이터 분류 기준은 어떻게 할까요?_퀵데이터 데이터란?? 문자와 수치등의 표현한 것을 모아놓은 자료 데이터 분류 ​ ⅰ. 수치 데이터 · 비례척도 : 비율척도 또는 비례척도라 합니다. 수치 데이터의 대부분은 비례척도로 덧셈, 뺄셈, 곱셈, 나눗셈을 해서 구한 비율을 의미합니다. · 간격척도 : 간격척도는 덧셈과 뺄셈은 가능하지만 곱셈이나 나눗셈 해서 '몇배'라 할 수 없는 데이터입니다. ex) 온도-'30도는 10도의 3배'입니다하고 할 수 없습니다. ​ ⅱ. 수치가 아닌 데이터 · 순서척도 : 수치가 아닌 '순서'를 의미하는 것입니다. ex) 설문지에 ①매우만족 ②만족 ③보통 ④불만족 ⑤매우불만족 에 대한 대답 · 명목척도 : 순서에 의미가 없지만 카테고리로 묶는 것입니다. 표본의 특징에 따라 하부 계층을 표시하고 서로 대립되는 범주를 분류하기 ..
표준정규분포, 우리 일상에 항상 함께 하는 통계학의 기본 정규분포 쉽게 알아보기_퀵데이터 ​ ​ 데이터가 흩어진 정보를 보여주는 지표로는 표준편차가 있습니다. 상대도수 히스토그램은 각각의 계급마다 몇 %의 데이터가 있는가에 대하여 비율을 알 수 있는 그래프입니다. 표준편차를 이용해서도 비율을 알 수 있습니다. 예를 들어 성인 남자 키가 평균 170cm, 표준편차 6cm의 데이터가 있다고 해볼게요. 이 2개의 데이터만으로도 성인 남자 키가 어떤 식으로 분포되어 있는가를 알 수 있답니다. 실제로 키는 ‘정규분포’ 형태에 매우 가까운데, 이를 사용하면 182cm인 남성은 상위 2%, 즉 100명 중 2번째라는 것을 알 수 있습니다. 이렇게 우리 실생활에는 정규분포로 볼 수 있는 예가 아주 많답니다. ​ ​ *정규분포는 좌우대칭의 종모양을 하고 있습니다. 정규분포를 따르는 데이터에서는 평균값에서 표..
표준편차 구하는 방법 쉽게 알아보기_퀵데이터 ​ 실제 표준편차(σ)를 사용하면 데이터의 흩어진 정도를 알 수 있습니다. 이 표준편차는 어떻게 계산할까요? ​ ​ 먼저 편차를 알아야 하는데 편차란 각 데이터가 평균값에서 어느 정도 떨어져 있는가를 나타냅니다. 편차 = 데이터 값 - 평균값 ​ ​ 마케팅 부서 A팀과 B팀이 각 10명씩 실적 평가를 했다고 가정해 볼게요. 아래와 같이 평가 점수표가 있는데 그래프의 방향과 크기로 편차의 차이를 시각화 했습니다. 두 데이터는 평균값이 5점으로 같지만 편차를 시각화해서 비교해보면 A팀이 더 많이 흩어져 있음을 알 수 있죠? *평균 0에 양수와 음수로 표현되는 편차를 모두 더하면 반드시 0이 됩니다. ​ ​ 표준편차와 분산 : 편차를 사용해 흩어진 정도를 표현하는 두 가지 방법 그렇다면 A팀이 더 흩어져 있다..
데이터가 흩어진 정도, 표준편차 사용방법은?_퀵데이터 통계학은 데이터 값이 얼마나 흩어져 있는가에 주목 ​ 일상적으로 통계와 관련하여 데이터 값의 중심(평균값, 중앙값, 최빈값 등)으로 생각하는데, 통계학에서는 데이터가 얼마나 흩어져 있는지에 주목해야 합니다. 데이터 값이 평균값 주변에 어떤 식으로 분포되고 또 떨어져 있는가를 알아내기 위한 것으로 통계학에서는 매우 중요합니다. ​ 중심을 나타내는 지표를 대표값, 흩어진 정도를 나타내는 지표를 산포도라 합니다. 대표값이 여러 개였던 것처럼 산포도 역시 여러 가지 지표를 가지고 있습니다. 그중에서 먼저 표준편차부터 알아보겠습니다. ​ ​ 다음과 같이 예를 들어볼게요. A팀(10명) 점수 2,3,3,4,4,5,7,7,7,8 평균값 = 50÷10 = 5점 ​ B팀(10명) 점수 3,4,4,5,5,5,6,6,6,6..
[퀵데이터] 산술평균과 기하평균 중 매출 증가율 구하는 방법은? ​ 일상생활에서 자주 사용하는 평균은 데이터들을 더해서 구합니다. 즉 덧셈의 합계를 데이터 수로 나눈 값이고 이것을 산술평균이라고 합니다. 반면, 기하평균은 데이터들을 곱해서 구하고 이는 증가율의 평균을 산출할 때 사용합니다. ​ ​ 산술평균과 기하평균을 예로 들어 볼게요. 아래와 같은 데이터가 있다고 가정하겠습니다. 5개의 데이터와 5개의 ㅁ로 산술평균과 기하평균을 구해보겠습니다. ​ ​ 산술 평균 데이터의 합계 21을 데이터 수 5로 나눈 값이 산술평입니다. 결국 산술평균값을 ㅁ라고 하면 5개이 ㅁ를 더한 값과 원 데이터를 더한 값이 같아집니다. ​ ​ 기하 평균 5개의 ㅁ를 곱한 값이 데이터를 모두 곱한 값과 같다고 하고 ㅁ를 계산합니다. 이 경우 데이터를 곱한 값 32의 5제곱근을 구하면 기하 평..
데이터 코딩이 무엇인지 알아보겠습니다. 설문 자료 코딩 자료의 코딩은 수집된 설문지 응답자료를 숫자로 표현하여 입력하는 것인데요, 코딩할 때 분석 방법을 생각하며서 코딩해야 합니다. ​ 그러니까 설문지, 코딩, 분석이 상호 연계성을 갖도록 설문지가 개발되어야 겠지요~~^^ 코딩은 SPSS 혹은 엑셀을 이용하여 입력하는데 설문지 응답을 엑셀로 저장 기록 하였다면 큰 문제 없어요. Ctrl + F키를 눌러 변수명을 바꾸기만 하면 되구요, 그 이후에는 SPSS에서 불러오기가 가능하답니다. ​ 예를 들어 설문에 있어 다음 데이터와 같은 응답으로 기록이 되어 있다고 한다면, 이것은 어디까지나 그냥 예시 입니다. 심각하게 받아들이면 곤란합니다~~^^ ​ ​ ​ 엑셀일 경우, Ctrl + F (모두 바꾸기)를 눌러서 다음 표와 같이 변환시켜 주고, SPS..
변수계산에 대해서 '퀵데이터'에서 알아보겠습니다. 대표사진 삭제 사진 설명을 입력하세요. 변수계산 합 or 평균 출처 입력 변수 계산은 원자료를 분석하는 과정에서 필요에 따라 기존 변수를 가공하여 새로운 변수를 만들고자 할 때 사용하며 산술 및 다양한 함수 형태를 만들 때 사용됩니다. 변수들을 합하거나 평균을 낸다는 것은 리커트 척도로 된 여러 문항을 하나로 만들겠다는 의미이고, 회귀분석 등을 할 때 많이 이용되어지는데, 일반적으로 변수들의 합 혹은 평균을 계산하여 사용됩니다. 예를 들어 설문지 중에 "업무 만족도"라는 변수가 있다고 가정해 볼게요. 업무 만족도의 변수에서 업무만족도1, 업무만족도2, 업무만족도3의 각 요인들의 질문이 있다고 한다면, 합의 변수계산은 변환 - 변수계산 - 새로운창에서 목표변수에 "업무만족도합"이라고 쓰고 - 함수집단에서 ..
빈도분석의 자세한 설명. 퀵데이터에서 알아보겠습니다. ​ ​ 빈도 분석(Frequencies) ​ 빈도분석은 입력된 데이터들이 도수분포표 상에서 표본이 어떠한 분포적 특성을 가지고 있는지 파악하는데 사용됩니다. 그리고, 데이터를 다른 통계적 방법에 적용하기 전 데이터에 오류가 있는지 점검할때도 유용한데, 이상치가 나오거나 한다면 코딩 오류이거나 데이터 입력 오류이니까 데이터 클리닝을 해야 합니다. ​ 인구사회학적 특성의 변수를 확인하고 그 변수들의 빈도 분석을 예로 들어보겠습니다. ​ SPSS에서 분석 - 기술통계량 - 빈도분석 을 클릭 연령, 성별, 직급 클릭 - 변수창으로 이동 - 확인 ​ 코딩 데이터에서 연령, 성별, 직급을 빈도분석한 결과 입니다. ​ ​ ​ 통계량 결과표에서 유효는 응답 케이스, 결측은 무응답 케이스를 말합니다. 결측이 0이 아닐 ..