본문 바로가기

논문/논문통계

(55)
P 값의 'P'는 뭘 까요?? 퀵데이터에서 알아봐요^^ P 〈 0.05 통계에서 사용하는 기호하면 우리가 가장 많이 본 P 일 것입니다. 학술지나 논문을 읽다 보면 P가 나옵니다. ​ For example... · 시험약 투약 후의 혈중 콜레스테롤 수치는 남녀 간의 유의차를 인정하지 않았다 (P=0.07). · 약물 투여 후의 혈압 강하는 A 그룹이 B 그룹에 비해 유의하게 컸다 (P
통계는 왜 필요할까요???_퀵데이터 어느 TV프로그램에서 「당신도 이것만 1주일 먹으면 살을 뺄 수 있다!!!」 란 문구를 보았습니다. 견과류를 하루에 30g 먹는 것만으로 1주일 후에 살이 빠진다는걸 과학으로 증명하는 것이였다. 오호~~ 이런 놀라운 방법이 ㅎㅎㅎ 모두들 이런 솔깃한 문구에 시선을 사로잡혀 TV를 보게 됩니다. 실험은 살을 빼고 싶은 8명의 여성을 대상으로 견과류의 효과를 검정하고 있습니다. ​ 실험 전에 체지방률, 체중을측정하고 채혈까지 해서 혈중 콜레스테롤 수치를 측정합니다. 그 후 4명에게는 1주일 동안 견과류를 먹게 하고 다른 4명은 견과류를 먹지 않도록 해 1주일 후 다시 처음 했던 검사를 하게 됩니다. ​ ​ 1주일 후 결과는 아래와 같습니다. 결과를 보고 어떤 생각이 드셨나요??? "오호~~~ 당장 마트에 가..
통계학의 척도! 데이터 분류 기준은 어떻게 할까요?_퀵데이터 데이터란?? 문자와 수치등의 표현한 것을 모아놓은 자료 데이터 분류 ​ ⅰ. 수치 데이터 · 비례척도 : 비율척도 또는 비례척도라 합니다. 수치 데이터의 대부분은 비례척도로 덧셈, 뺄셈, 곱셈, 나눗셈을 해서 구한 비율을 의미합니다. · 간격척도 : 간격척도는 덧셈과 뺄셈은 가능하지만 곱셈이나 나눗셈 해서 '몇배'라 할 수 없는 데이터입니다. ex) 온도-'30도는 10도의 3배'입니다하고 할 수 없습니다. ​ ⅱ. 수치가 아닌 데이터 · 순서척도 : 수치가 아닌 '순서'를 의미하는 것입니다. ex) 설문지에 ①매우만족 ②만족 ③보통 ④불만족 ⑤매우불만족 에 대한 대답 · 명목척도 : 순서에 의미가 없지만 카테고리로 묶는 것입니다. 표본의 특징에 따라 하부 계층을 표시하고 서로 대립되는 범주를 분류하기 ..
표준정규분포, 우리 일상에 항상 함께 하는 통계학의 기본 정규분포 쉽게 알아보기_퀵데이터 ​ ​ 데이터가 흩어진 정보를 보여주는 지표로는 표준편차가 있습니다. 상대도수 히스토그램은 각각의 계급마다 몇 %의 데이터가 있는가에 대하여 비율을 알 수 있는 그래프입니다. 표준편차를 이용해서도 비율을 알 수 있습니다. 예를 들어 성인 남자 키가 평균 170cm, 표준편차 6cm의 데이터가 있다고 해볼게요. 이 2개의 데이터만으로도 성인 남자 키가 어떤 식으로 분포되어 있는가를 알 수 있답니다. 실제로 키는 ‘정규분포’ 형태에 매우 가까운데, 이를 사용하면 182cm인 남성은 상위 2%, 즉 100명 중 2번째라는 것을 알 수 있습니다. 이렇게 우리 실생활에는 정규분포로 볼 수 있는 예가 아주 많답니다. ​ ​ *정규분포는 좌우대칭의 종모양을 하고 있습니다. 정규분포를 따르는 데이터에서는 평균값에서 표..
표준편차 구하는 방법 쉽게 알아보기_퀵데이터 ​ 실제 표준편차(σ)를 사용하면 데이터의 흩어진 정도를 알 수 있습니다. 이 표준편차는 어떻게 계산할까요? ​ ​ 먼저 편차를 알아야 하는데 편차란 각 데이터가 평균값에서 어느 정도 떨어져 있는가를 나타냅니다. 편차 = 데이터 값 - 평균값 ​ ​ 마케팅 부서 A팀과 B팀이 각 10명씩 실적 평가를 했다고 가정해 볼게요. 아래와 같이 평가 점수표가 있는데 그래프의 방향과 크기로 편차의 차이를 시각화 했습니다. 두 데이터는 평균값이 5점으로 같지만 편차를 시각화해서 비교해보면 A팀이 더 많이 흩어져 있음을 알 수 있죠? *평균 0에 양수와 음수로 표현되는 편차를 모두 더하면 반드시 0이 됩니다. ​ ​ 표준편차와 분산 : 편차를 사용해 흩어진 정도를 표현하는 두 가지 방법 그렇다면 A팀이 더 흩어져 있다..
데이터가 흩어진 정도, 표준편차 사용방법은?_퀵데이터 통계학은 데이터 값이 얼마나 흩어져 있는가에 주목 ​ 일상적으로 통계와 관련하여 데이터 값의 중심(평균값, 중앙값, 최빈값 등)으로 생각하는데, 통계학에서는 데이터가 얼마나 흩어져 있는지에 주목해야 합니다. 데이터 값이 평균값 주변에 어떤 식으로 분포되고 또 떨어져 있는가를 알아내기 위한 것으로 통계학에서는 매우 중요합니다. ​ 중심을 나타내는 지표를 대표값, 흩어진 정도를 나타내는 지표를 산포도라 합니다. 대표값이 여러 개였던 것처럼 산포도 역시 여러 가지 지표를 가지고 있습니다. 그중에서 먼저 표준편차부터 알아보겠습니다. ​ ​ 다음과 같이 예를 들어볼게요. A팀(10명) 점수 2,3,3,4,4,5,7,7,7,8 평균값 = 50÷10 = 5점 ​ B팀(10명) 점수 3,4,4,5,5,5,6,6,6,6..
[퀵데이터] 산술평균과 기하평균 중 매출 증가율 구하는 방법은? ​ 일상생활에서 자주 사용하는 평균은 데이터들을 더해서 구합니다. 즉 덧셈의 합계를 데이터 수로 나눈 값이고 이것을 산술평균이라고 합니다. 반면, 기하평균은 데이터들을 곱해서 구하고 이는 증가율의 평균을 산출할 때 사용합니다. ​ ​ 산술평균과 기하평균을 예로 들어 볼게요. 아래와 같은 데이터가 있다고 가정하겠습니다. 5개의 데이터와 5개의 ㅁ로 산술평균과 기하평균을 구해보겠습니다. ​ ​ 산술 평균 데이터의 합계 21을 데이터 수 5로 나눈 값이 산술평입니다. 결국 산술평균값을 ㅁ라고 하면 5개이 ㅁ를 더한 값과 원 데이터를 더한 값이 같아집니다. ​ ​ 기하 평균 5개의 ㅁ를 곱한 값이 데이터를 모두 곱한 값과 같다고 하고 ㅁ를 계산합니다. 이 경우 데이터를 곱한 값 32의 5제곱근을 구하면 기하 평..