2)意思決定のツール バラつきの概念

2007年12月16日 日曜日

早嶋です。



数値とカテゴリ」では、数値データをざっくり見るために、代表値の紹介をしました。数値データの代表値は、平均や中央値、最頻値など、カテゴリデータの代表値は割合や比率でしたね。



今回は、その中でも平均に注目してみます。例えば、次のような事例を考えて見ましょう。



あなたは今、中央区(①)と東区(②)の両方にパン屋を展開しているビズナビベーカリーのオーナーだとします。ビズナビベーカリーは地域に密着したベーカリーショップを目指しているために、顧客のリピート率を1つの経営指標として様々な意思決定を行っています。



さて、そのような中、あなたは、①と②の今年度の顧客リピート回数を年間100回と設定しました。そして、①と②では、それぞれの顧客データの蓄積により、目標を達成したと報告がありました。



【報告内容】

①、②の店舗とも顧客数は10人。その顧客のリピート回数を調査して、それぞれ平均を出したところ丁度、100回だった。



パン平均



さて、①と②、共に目標を達成したと言えるでしょうか?今回のゴールは、顧客のリピート回数を100回を上回ることですので、平均を見る限り、①も②も満たしていますね。



では、どちらがより確実に目標を達成しているといえるでしょうか?それを調べるために、「バラつき」を見てみましょう。平均値が同じならば、全てのお客様が平均の100回に近い回数をリピートしている方が望ましいといえるでしょう。



1)レンジ(幅)を見る

ざっくり把握するためには、レンジを見ましょう。レンジは、データを昇順か降順に並べて最大値と最小値の差を見ることです。

①の場合、最小90回で最大112回なのでレンジは22ですね。同様に、②の場合、最小75回で最大が224回なのでレンジは146です。

レンジを調べるだけで、②の方がバラつきが大きいことがわかりますね。



では、バラつきをもっと的確に表現するにはどうすると良いでしょうか?コレが、小学校のときに習った標準偏差です。標準偏差=バラつきを表す1つの指標、と考えればOKです。



2)標準偏差を計算する

計算方法は割愛して、①の標準偏差は6.41、②の標準偏差は43.97となります。コレを見ると明らかに②>①なので、②の方がバラつきが多いということがわかります。



パン屋さんの例では、リピート回数の目標達成に対して、平均というアプローチと標準偏差というアプローチの2つを取りました。平均値だけでは、①と②のバラつきがどの程度なのか?を考慮していないことがわかります。



実際の経営環境では、平均値は多く使われますが、ある異常値が全体の平均値を上げる(又は、下げる)動きをしていることが良くあります。しかし、標準偏差でバラつきまで把握しておけば、そのようなことも防ぐことが出来るのです。



統計では、データの全体像を捉えるために、平均と標準偏差をセットで用いることが良くあります。



コメントをどうぞ

CAPTCHA