본문 바로가기

공공기관, 기업 데이터분석

고객에게 적시배송을 위해 우리 회사는 얼마큼의 최적 재고를 가지고 있어야 할까?_ 신뢰구간 추정 알아보기_추정의 기본원리_퀵데이터

추정의 목적은 표본 통계량에 기초하여 모수의 근삿값을 결정하는 것입니다. 예를 들면 표본평균은 모평균을 추정하기 위해 사용되죠. 따라서 표본평균은 모평균의 추정량(estimator)이라 하고 표본평균이 계산되면 이 같은 표본 평균 값은 모평균의 추정치(estimate)이라고 합니다.

모수를 추정하기 위해 점추정량, 구간추정량 두 가지 방법으로 모수를 추정할 수 있습니다.

점추정량(point estimator) : 하나의 값을 사용하면서 알려져 있지 않은 모수의 값을 추정함으로써 모집단에 대한 추론을 함

점추정량은 큰 표본크기의 효과를 반영하지 못한다는 단점이 있어, 이럴 때 구간추정량을 사용합니다.

구간추정량(interval estimator) : 구간을 사용하면서 알려져 있지 않는 모수의 값을 추정함으로써 모집단에 대한 추론을 함

구간추정량은 표본크기에 의해 영향을 받기 때문에 보통 구간추정량을 많이 사용합니다.

예를 들면

MBA출신 직장인들이 연간 벌어들이는 소득을 추정하고자 한다고 했을 때, 임의로 100명의 MBA 출신 직장인들을 선택하고 연 평균 소득의 표본평균이 5천만원이라고 계산할 것입니다. 점추정치는 표본평균으로 MBA출신 직장인들이 연 간 소득의 평균은 5천만원이라고 추정하는 것이죠.

한편 구간추정치를 사용할 수도 있을것인데 MBA출신 직장인들의 연 평균 소득은 4800만원과 5200만원 사이라고 추정할 수 있을 것입니다.

이처럼 추정을 하고자 할 때 수많은 사람들을 대상으로 하기에는 비용이나 시간적으로 불리합니다. 따라서 모집단으로부터 한 임의표본을 추출하여 비율을 계산하고 이 표본비율을 모비율의 추정량으로 사용하는 것이죠.

모비율을 추정하기 위해 표본비율을 사용하는 것은 논리적인 것처럼 보일 수 있으나 추정량으로 사용되는 표본통계량의 선택은 표본통계량의 특성에 의존하므로 당연히 가장 바람직한 측성을 가진 통계량이 사용되어야 합니다.

이때 추정량의 바람직한 특성 중 하나는 불편성(unbiasedness)입니다.

불편추정량(unbiased estimator) : 그 기대치가 모수와 같은 추정량

무한히 많은 수의 표본을 추출하여 각 표본에서 추정량의 값을 계산하면 추정량의 평균값이 모수와 같을 것이라는 것을 의미합니다. 이것은 평균적으로 표본통계량은 모수와 같다고 말하는 것과 같겠죠. 추정량이 불편추정량이라는 것은 그 기대치가 모수와 같다는 것만을 의미하지 추정량이 모수와 얼마나 가까운지를 말해주지는 않습니다.

바람직한 추정량의 다른 하나의 특성은 표본크기가 커짐에 따라 표본 통계량이 모수에 더 가까워져야 하는 것인데 이같은 특성을 일치성(consistency)이라고 합니다.

일치성(consistency) : 표본크기가 커짐에 따라 추정량과 모수의 차이가 더 작아진다면 불편추정량은 일치성을 가짐

이제 구간추정량이 표본분포로부터 어떻게 구해지는가 예를 들어 보겠습니다.

의류를 판매하고 있는 A사가 인터넷을 통해 주문하는 고객들에게 직배송한다고 가정하겠습니다. A사는 가격과 배송 속도로 경쟁하는데 배송속도의 목적을 달성하기 위해 A사는 가장 인기 있는 5개의 의류제품을 만들고 전국에 퍼져 있는 창고로 수송합니다. 의류들은 일반적으로 고객에게 인도하는데 1일이 걸리는 창고들에 저장됩니다.

이 같은 전략은 비용을 크게 증가시키는 높은 재고 수준을 필요로 하기 때문에 A사는 비용을 감소시키기 위한 재고모형을 사용하고자 합니다. 일일수요와 리드타임 동안의 수요 모두 확률변수라는 것을 알고 있으며 리드타임 동안의 수요는 정규분포를 따른다고 결론짓고 최적 재고모형을 계산하기 위해 모평균을 알아보고자 했습니다.

25개의 리드타임을 관측하고 각 리드타임 동안의 수요를 아래와 같이 기록하였습니다.

A사는 리드타임 동안의 평균 수요에 대한 95% 신뢰구간 추정치를 구하기 원하고 오랜 경험을 바탕으로 표준편차가 75개라는 것을 알고 있다고 시나리오를 만들어 봤습니다.

A사는 최적 재고수준을 구하기 위해 리드타임 동안의 평균 수요를 알아야 합니다. 따라서 추정되어야 하는 모수는 μ(뮤)이고, 여기서 신뢰구간추정량은 다음과 같은 식을 사용합니다.

μ의 신뢰구간 추정치를 계산하기 위해 아래와 같은 4개의 값이 필요합니다.

리드타임 동안의 수요 전체 합은 9,254개 입니다.

이것으로부터 표본평균은 다음과 같이 계산됩니다.

신뢰수준은 95%로 설정됩니다.

따라서

1 - α = .95, α = 1- .95 = .05, α / 2 = .025 가 됩니다.

이에 대한 누적표준정규확률표를 참조하되 가장 많인 사용되고 일반적으로 많이 사용되는 신뢰수준 구간은 아래와 같습니다.

*인터넷에 검색하면 정규확률표는 쉽게 구할 수 있습니다.

모표준편차 σ = 75이고 표본크기는 25입니다.

μ에 대한 신뢰구간 추정량에 위의 값들을 대입합니다.

따라서 신뢰하한 LCL = 340.76이고 신뢰상한은 UCL = 399.56이 됩니다.

즉, A사는 리드타임 동안의 평균 수요는 340.76과 399.56 사이라고 추정할 수 있습니다. 이러한 추정치로 재고전략을 수립하는데 하나의 투입요소로 사용할 수 있습니다.

보통 기업들이 사용하는 재고 예측 모형은 특정한 리드타임 동안의 평균 수요 값을 가정하면서 재주문점을 결정합니다. 위 예처럼 신뢰구간 추정량은 기업이 가능한 결과들을 이해할 수 있도록 신뢰하한과 신뢰상한 모두를 사용할 수 있는 유용한 분석방법 입니다.


이상 퀵데이터에서 추정의 기본과 신뢰구간을 추정하는 방법 등에 대해 알아보았습니다.

기업 데이터 통계 분석!!

만족도 조사, 시장 조사, 마케팅 조사!!

다양하고 정확한 통계분석으로 기업 전략 업그레이드!!

퀵데이터가 함께 합니다.

(주)한국교육데이터

 

 

#추정량 #신뢰구간추정 #재고 #적시배송 #주문량 #기업전략 #기업통계 #기업데이터 #통계분석 #설문 #리서치 #서베이 #퀵데이터 #한국교육데이터