" 논문에 사용되는 논문통계분석 구조방정식모형(SEM)에 대해 알아보기"


▣ 구조방정식에 사용되는 변수 설명
■ 잠재변수
- 인관관계는 일방향 화살표로 표시하고 시작은 원인변수, 끝은 결과변수로 구분
- 잠재변수(구성개념)는 직접적으로 측정하기 어려운 이론적 개념을 나타내는 변수
- 추상적이라 하나의 문항인 단일지표로 측정은 어렵고, 여러 문항인 다중지표로 측정
- 문항 응답 값의 공통분산을 계산하여 잠재변수의 추정값으로 사용

사회과학의 많은 연구에서 추상적 개념 간 관계를 분석한다. 추상적인 것은 구체적 정보가 아닌 다소 개념적인 측정 수준을 의미한다. 구체적 정보는 성별, 나이, 사용횟수 등으로 하나의 문항으로 측정할 수 있다. 그러나 추상적 개념에 있어 OTT 서비스의 시스템품질을 측정하는데 “사용하는데 편리한 기능을 가지고 있는가”라고 단 하나의 문항만 측정하는 것은 충분하지 않다. 시스템품질은 포괄적이고 응답자마다 달리 생각할 수도 있다. 그래서 더 구체적으로 여러 질문을 구성해야 한다. 그림과 같이 타원으로 된 구성개념이 잠재변수이며, 시스템품질을 측정하기 위해 문항 3개를 구성하는 것이다. 잠재변수는 직접 측정한 문항이 아니라 문항 간에 숨겨진 공통된 값을 의미해서 잠재변수라고 한다.
■ 관측변수
- 관측변수는 비교적 명확히 정의되어 직접적인 측정이 가능한 변수
- 잠재변수를 대표할 수 있는 조작적 정의를 측정 가능하도록 구성한 변수
- 설문조사일 때는 각 문항이, 실험연구 및 직접 측정한 수치일 때 관측변수
- 하나의 잠재변수에 많은 관측변수는 모형의 복잡성으로 모델적합도 저해(항목합산으로 해결)

예를 들어, 시스템품질이라는 잠재변수는 OTT 서비스의 기능적, 기술적 품질에 대한 사용자의 인지정도로 고객이 편리하고 이용하기 쉽게 구성된 시스템으로 개념적 정의를 할 수 있다. 개념적 정의를 토대로 시스템품질을 제대로 측정해 줄 수 있는 조작적 정의를 통해 잠재변수를 측정할 수 있는 것이다. 조작적 정의는 매우 중요하고 잠재변수를 측정하는데 나침반의 역할을 하는 것이다.
- 많은 관측변수는 모델의 복잡성과 연관되어 모델적합도 및 모수 추정 유의성에 영향을 미침
- 측정문항이 수십~백개가 넘는다면 동시 분석하는 것은 불가능(항목합산으로 모델을 구체화)
- 단, 신뢰성과 타당성이 검증되었을 경우와 측정항목이 단일차원이라는 가정하에서만 가능
- 항목합산 방법
- 신뢰도 및 집중타당성 검증 후 평균(총점) 등으로 합산하여 단일변수로 변환(경로분석)
- 선행연구의 이론적 근거를 바탕으로 하위요인들을 기준으로 분류(확인적 요인분석)
- 선행연구에 따른 하위 요인 제시하지 않을 때 요인 추출하여 분류(탐색적 요인분석)
- 단일항목 합산은 모델을 단순화하여 높은 적합도를 얻을 수 있지만, 잠재변수 하위요인들에 대한 특징이 사라짐을 주의

하나의 잠재변수당 관측변수의 수는 3개 이상에서 10개 이내가 좋다. 3개 미만의 관측변수는 정보의 양이 충분치 않아서 모수 추정이 어려울 수 있다. 무엇보다 잠재변수가 추상적 개념이라 여러 문항을 측정하는 것인데 1~2개로 구성할 정도로 충분하다는 것은 추상적이 개념이 아닌 것이다.
■ 외생변수, 내생변수, 외생잠재변수, 내생잠재변수
- 원인과 결과로 구분하기 보다 변수값이 모형 내 혹은 모형 외에서 생성되는가에 따라 구분
- 내생변수: 한번이라도 결과변수가 되는 변수를 다른 변수에 의해 영향을 받는 변수 (한번이라도 화살표를 받는 변수)
- 외생변수: 다른 변수에 의해 전혀 영향을 받지 않고 다른 변수에 영향을 주기만 하는 변수(한번이라도 화살표를 주는 변수)
- 외생잠재변수: 모형 외부의 다른 요인들에 의해 영향을 받는 변수
- 내생잠재변수: 모형 내의 잠재변수에 의해 직간접으로 영향을 받는 변수

■ 오차변수
- 구조방정식은 각 측정변수의 오차와 변수에 의해 설명되지 않는 오차를 추정함
- 오차를 추정하면 변수 간 영향관계의 경로계수를 더욱 정확히 추정함
- 회귀분석이나 경로분석은 항목합산된 정보만 남아 측정오차를 알 수 없음
- 구조방정식은 측정변수의 개별값 정보가 그대로 반영되고 각 관측변수의 오차를 알 수 있음
- 측정오차는 관측변수가 잠재변수를 완전히 설명하지 못하는 정도이고 다양한 원인으로 발생
- 구조오차는 독립변수들에 의해 설명이 안되는 변량으로 잠재변수들의 오차(잔차, 교란)

- 회귀분석이나 경로분석은 항목합산된 정보만 남아 측정오차를 알 수 없음
- 구조방정식은 측정변수의 개별값 정보가 그대로 반영되고 각 관측변수의 오차를 알 수 있음
관측변수에는 반드시 하나의 측정오차가 설정되는데 관측변수에서 응답의 비일관성을 계산하는 것이다. 응답자들이 비일관적인 응답을 하는 이유는 측정 되구나 척도가 완전하지 않은 문제, 또는 설문 과정에서 다른 환경(온라인, 오프라인 등 조사환경, 조사시간 등등) 등에 의해 나타날 수 있다. 또는 연구자가 데이터에 수치를 잘못 기입하거나 코딩의 문제, 응답자가 질문을 제대로 이해하지 못하는 문제 등도 있다. 이런 문제들은 연구방법론적이고, 구조방정식의 측정오차는 잠재변수가 관측변수를 설명하고 난 나머지 부분으로 설명하지 못하는 부분의 오차를 말한다. 다시 말해 관측변수가 잠재변수를 완전하게 설명하지 못하는 정도를 말한다.
구조오차는 내생변수가 다른 변수들에 의해 설명되고 난 나머지 부분으로 설명이 안 된 부분을 의미한다.
예시) 시스템 품질1(4점) 시스템 품질2(5점) 시스템 품질3(4점)

구조방정식에서는 측정변수의 오차와 독립변수에 설명되지 않는 오차를 추정한다. 오차를 추정하면 변수가 변수에 미치는 영향 정도인 경로계수를 더욱 정확히 추정할 수 있다.
예를 들어, OTT 시스템품질을 측정한다고 할 때 “OTT를 사용하는데 편리한 기능을 가지고 있다” 등 3개의 문항을 5점 척도로 측정하였다. 관측변수인 3개의 문항 값을 평균 혹은 합산하여 시스템품질이라는 잠재변수를 구성한다. 그런데 3개 문항에서 한 응답자가 4점, 5점, 3점이라고 답했다면 평균이 4.33점이 된다. 잠재변수인 시스템품질이 4.33이지만 관측변수인 개별 문항의 4점, 5점, 3점은 없어진다. 결국 일관적이지 않게 응답했던 오차 부분을 계산하지 못하는 것이다. 반면 구조방정식은 3개 문항 값을 그대로 반영한다. 평균이나 합산하지 않고 시스템품질1, 2, 3의 응답값은 관측변수로 설정해서 개별 응답값을 그대로 반영하다. 일관적이지 않은 응답 수준(측정오차)을 오차항으로 설정해서 추정하는 방식이다. 이로써 시스템품질과 다른 변수 간의 경로계수 값을 더 정확히 추정하는 것이다.
이상 구조방정식에 사용되는 변수에 대해 살펴보았습니다.
알거 같으면서 지나고 나면 또 헷갈리시지요. 계속해서 보는 방법말고는 방법이 없습니다. 구조방정식의 용어가 어렵다면 퀵데이터 통계분석 강의 유튜브를 반속 시청해주세요~
[논문통계분석] 2편 구조방정식에 사용되는 변수 설명_퀵데이터 논문통계 강의 보기▼▼▼
"논문의 품질을 높이는 열쇠!!!
퀵데이터 논문통계분석을 통해 더욱 탄탄한 논문을 완성하세요."
퀵데이터 논문컨설팅은 논문 주제 선정부터, 연구모형, 통계분석, 심사 준비까지 전문 지도 박사님의 1:1 맞춤형 컨설팅 통해 효율적이고 빠른 논문작성을 도와드립니다. 논문 검토, 논문편집, 논문 통계분석까지 직접적인 컨설팅을 원한다면 퀵테이터에 문의하세요 상담문의 1600-7473
홈페이지 : www.quickdata.co.kr 대표번호 : 1600-7473 e-mail : quickdata7@naver.com
