본문 바로가기

논문/논문통계

[논문통계분석] 1편 군집분석이란? / 계층적군집분석 / 비계층적군집분석 / SPSS를 이용한 군집분석 /통계분석 강의

 

 

”군집분석란 무엇인가요?“

“논문 작성할 때 군집분석 및 해석은 어떻게 해야 하나요?”

“논문에서 사용되는 군집분석은 어떤 분석방법을 이용해야 하나요?”

”논문 작성할 때 군집분석은 어떻게 활용해야 할까요?“

“군집분석의 계층적 군집, 비계층적 군집 분석의 차이는 뭔가요?”

 

논문통계 및 논문컨설팅 상담 1600-7473

 


 

▣ 군집분석이란?

 

군집분석은 관측된 특성이나 설문의 응답 내용을 바탕으로 수행되고 서로 유사한 특징을 지니거나 유사한 답변들을 한 케이스들을 동일한 집단으로 분류하는 것이다.

 

  • 데이터의 개별 케이스를 상호 관련성을 바탕으로 동질적인 집단으로 묶어주는 통계분석
  • 데이터의 분석대상들은 군집분석에 의해 두 개 이상의 집단으로 분류(군집, Cluster)
  • 군집 내 분석대상들은 서로 동질적인 특성, 군집 간에는 이질적인 특성
  • 개인 또는 여러 개체 중에서 유사한 속성을 지닌 대상을 몇 개의 집단으로 그룹화
  • 개별 케이스가 속할 집단이 사전에 결정되어 있지 않고 케이스들을 통해 실제의 집단을 찾아냄

 

데이터 구조의 동질성 파악

 

개별 케이스 분류해 범주화

 

▣ 유클리디안 거리

  • 거리값은 대표적으로 유클리디안 거리(Euclidean Distance)
  • 두 지점 간의 거리를 계산할 때 직각삼각형의 원리 이용
  • 유클리디안 거리는 단일결합, 완전결합, 평균결합법 사용할 때
사진 삭제

사진 설명을 입력하세요.

  • 제곱 유클리디안 거리는 Ward법 사용할 때

척도의 구분

  • 자료의 척도는 간격척도 혹은 비율척도로 측정된 거리값(경우에 따라 명목, 서열척도(더미) 가능)
  • 군집분석 시 변수들의 단위가 같은 경우에는 원자료 사용
  • 변수들의 단위가 다른 경우 변수들의 값을 표준화하여 표준화된 값 사용

 

 

▣ 군집추출방식

 

  • 보통 계층적 군집방법을 이용하여 군집화를 하고 그 결과로부터 가장 적절한 수의 군집 수를 결정한 후 비계층적 방법을 이용
  • 군집의 수를 정하는데 있어서 의미 있는 해석이 가능한 수준에서 정해야 함

 

■ 계층적 군집분석

  • 일반적으로 Ward법과 평균결합법을 많이 이용
  • 개별대상 간의 거리에 의해 가장 가까이 있는 대상들로부터 시작해 결합해 감으로써 나무모양의 계층구조를 형성해 가는 방법
  • 기준이 되는 대상들로부터 시작해 개별대상 간의 거리 기준으로 상향식(Bottom-up)으로 형성
  • 대상이 특정 군집에 소속되면 다른 군집으로 이동 불가
  • 이상값이 제거되지 않고 반드시 특정 군집에 속해야 하는 문제점(이상값 제거해야 함)
  • 군집이 형성되는 과정을 정확히 파악할 수 있지만 자료 수가 많으면 분석이 어려움

 

■ 비계층적 군집분석

  • 가장 많이 이용되고 적절한 수의 군집수를 미리 정한 다음 그에 따라 군집화
  • 계층적 군집과 같은 문제는 크게 없지만 군집 수를 사전에 지정해야 함
  • 군집 수를 다르게 하여 여러 번의 분석을 실행하고 한 개의 결과를 선택할 수 있음
  • 많은 자료를 빠르고 쉽게 분류할 수 있으나 군집을 형성하기 위한 초기 값에 따라 군집결과가 달라짐
  • 적절히 군집화가 되면 교차분석 및 분산분석을 이용해 군집 특성 판단

 

통계분석 군집분석이 궁금하다면 퀵데이터 논문통계 강의 보기▼▼▼

 

 

​"논문의 품질을 높이는 열쇠!!!

퀵데이터 논문통계분석을 통해 더욱 탄탄한 논문을 완성하세요."

 

퀵데이터 논문컨설팅은 논문 주제 선정부터, 연구모형, 통계분석, 심사 준비까지 전문 지도 박사님의 1:1 맞춤형 컨설팅 통해 효율적이고 빠른 논문작성을 도와드립니다. 논문 검토, 논문편집, 논문 통계분석까지 직접적인 컨설팅을 원한다면 퀵테이터에 문의하세요 상담문의 1600-7473​