본문 바로가기

공공기관, 기업 데이터분석

남여 간의 음주차이 분석해보기_기업 데이터분석을 통해 차별화된 마케팅전략 알아보기[퀵데이터]

직장인 음주실태 조사에 대해서 몇가지만 추려서 차이분석(독립표본 t검증, t-test)을 한것을 예로 들어보겠습니다.

(주)시원해맥주 신제품 개발로 시장을 확대하려 하고 있습니다. 개발에 앞서 직장인의 음주 실태를 파악해 신메뉴 개발에 반영할 계획입니다. 데이터 확보를 위해 (주)시원해맥주는 아래와 같은 설문항목을 개발하여 직장인을 대상으로 설문조사를 실행하였습니다. 총 538개의 데이터가 수집되었으며 남자 251명, 여자 287명으로 조사되었습니다.

 

설문지 : 직장인 음주실태조사
1. 귀하의 성별은 어떻게 되십니까?
① 남자 ② 여자
2. 귀하의 나이는 어떻게 되십니까?
① 20대 ② 30대 ③ 40대 ④ 50대이상
3. 귀하의 30일 평균 음주횟수는 어떻게 되시나요?
30일 평균 ( )회

검정하고자 하는 가설은 아래 표와 같습니다.

귀무가설 성별에 따라서 평균(30일) 음주횟수에 차이가 없다.
대립가설 성별에 따라서 평균(30일) 음주횟수에 차이가 있다.

그림 1을 살펴보면 남녀별 평균 음주횟수는 여자가 남자에 비해 음주 횟수가 더 적은것을 확인할 수 있습니다.

[그림1] 30일 평균 성별 음주횟수

[표1]을 살펴보면 남녀 간의 표본평균 차이는 1.07회(남자 4.67회, 여자 3.60회)로 남자가 여자에 비해 하루 정도 더 많이 마시는걸로 나타났습니다.

[표1] 성별 음주횟수

남자와 여자 두 집단 간 유의미한 차이가 있는가를 확인하기 위해 독립표본 t검증(t-test)을 실시하였습니다. [표2]를 살펴보면 검정결과 두 표본의 평균이 동일하다는가정하에서 표본평균의 차이가 1.071로 나타날 유의확률이 0.000으로 위의 귀무가설을 기각할 수 있습니다. Levene의 등분산검정결과 등분산 가정이 기각되었습니다. 여기에서 등분산이 가정되는 경우와 가정되지 않는 경우 모두 평균의 동질성에 대한 t검정 결과가 일치하며, 유의수준 0.01에서 성별에 따른 음주횟수에 차이가 없다는 귀무가설은 기각합니다.

[표2] 독립표본 t검정

말이 어렵습니다.ㅜㅜ

쉽게 성별 간 음주횟수에 따라 통계적으로 유의미하게(p<.001) 차이가 있다는 뜻입니다.^^

즉, 성별 간 음주횟수에 차이가 있으니 남녀 구분하여 다른 전략을 수립해야 한다는 것이죠.

만일 차이가 없다면 남녀 구분 하지 않고 전략을 수립하면 되구요.

(주)시원해맥주는 설문지를 토대로 통계분석 결과 상대적으로 음주횟수가 여성들이 적었으며 여성들을 위한 주류개발 및 할인, 우대이벤트, 여성들이 선호하는 남성모델 적용등 차별화 전략을 검토 중이라고 하였습니다.

위 사례는 기술통계분석 및 독립표본t검정을 이용해 통계분석을 하였습니다.

기술통계분석은 주요 변수의 평균, 표준편차, 최솟값, 최댓값, 변수의 정규성(왜도, 첨도)를 확인할 때 사용합니다.

독립표본 t검정은 두 집단 간 평균을 비교하는 통계 검정으로 독립변수는 범주형자료, 종속변수는 연속형 자료일때 평균에 유의한 차이가 있는지 확인합니다.

우리회사의 데이터를 어떻게 활용할지 고민 중이라면 통계분석을 이용해 의사결정을 해보시면 어떨까요.

 

(주)한국교육데이터