”군집분석란 무엇인가요?“
“논문 작성할 때 군집분석 및 해석은 어떻게 해야 하나요?”
“논문에서 사용되는 군집분석은 어떤 분석방법을 이용해야 하나요?”
”논문 작성할 때 군집분석은 어떻게 활용해야 할까요?“
“군집분석의 계층적 군집, 비계층적 군집 분석의 차이는 뭔가요?”
▣ 군집분석이란?
군집분석은 관측된 특성이나 설문의 응답 내용을 바탕으로 수행되고 서로 유사한 특징을 지니거나 유사한 답변들을 한 케이스들을 동일한 집단으로 분류하는 것이다.
- 데이터의 개별 케이스를 상호 관련성을 바탕으로 동질적인 집단으로 묶어주는 통계분석
- 데이터의 분석대상들은 군집분석에 의해 두 개 이상의 집단으로 분류(군집, Cluster)
- 군집 내 분석대상들은 서로 동질적인 특성, 군집 간에는 이질적인 특성
- 개인 또는 여러 개체 중에서 유사한 속성을 지닌 대상을 몇 개의 집단으로 그룹화
- 개별 케이스가 속할 집단이 사전에 결정되어 있지 않고 케이스들을 통해 실제의 집단을 찾아냄
데이터 구조의 동질성 파악
개별 케이스 분류해 범주화
▣ 유클리디안 거리
- 거리값은 대표적으로 유클리디안 거리(Euclidean Distance)
- 두 지점 간의 거리를 계산할 때 직각삼각형의 원리 이용
- 유클리디안 거리는 단일결합, 완전결합, 평균결합법 사용할 때

사진 설명을 입력하세요.
- 제곱 유클리디안 거리는 Ward법 사용할 때

척도의 구분
- 자료의 척도는 간격척도 혹은 비율척도로 측정된 거리값(경우에 따라 명목, 서열척도(더미) 가능)
- 군집분석 시 변수들의 단위가 같은 경우에는 원자료 사용
- 변수들의 단위가 다른 경우 변수들의 값을 표준화하여 표준화된 값 사용
▣ 군집추출방식
- 보통 계층적 군집방법을 이용하여 군집화를 하고 그 결과로부터 가장 적절한 수의 군집 수를 결정한 후 비계층적 방법을 이용
- 군집의 수를 정하는데 있어서 의미 있는 해석이 가능한 수준에서 정해야 함
■ 계층적 군집분석
- 일반적으로 Ward법과 평균결합법을 많이 이용
- 개별대상 간의 거리에 의해 가장 가까이 있는 대상들로부터 시작해 결합해 감으로써 나무모양의 계층구조를 형성해 가는 방법
- 기준이 되는 대상들로부터 시작해 개별대상 간의 거리 기준으로 상향식(Bottom-up)으로 형성
- 대상이 특정 군집에 소속되면 다른 군집으로 이동 불가
- 이상값이 제거되지 않고 반드시 특정 군집에 속해야 하는 문제점(이상값 제거해야 함)
- 군집이 형성되는 과정을 정확히 파악할 수 있지만 자료 수가 많으면 분석이 어려움
■ 비계층적 군집분석
- 가장 많이 이용되고 적절한 수의 군집수를 미리 정한 다음 그에 따라 군집화
- 계층적 군집과 같은 문제는 크게 없지만 군집 수를 사전에 지정해야 함
- 군집 수를 다르게 하여 여러 번의 분석을 실행하고 한 개의 결과를 선택할 수 있음
- 많은 자료를 빠르고 쉽게 분류할 수 있으나 군집을 형성하기 위한 초기 값에 따라 군집결과가 달라짐
- 적절히 군집화가 되면 교차분석 및 분산분석을 이용해 군집 특성 판단
통계분석 군집분석이 궁금하다면 퀵데이터 논문통계 강의 보기▼▼▼
"논문의 품질을 높이는 열쇠!!!
퀵데이터 논문통계분석을 통해 더욱 탄탄한 논문을 완성하세요."
퀵데이터 논문컨설팅은 논문 주제 선정부터, 연구모형, 통계분석, 심사 준비까지 전문 지도 박사님의 1:1 맞춤형 컨설팅 통해 효율적이고 빠른 논문작성을 도와드립니다. 논문 검토, 논문편집, 논문 통계분석까지 직접적인 컨설팅을 원한다면 퀵테이터에 문의하세요 상담문의 1600-7473