統計の基礎にヒストグラムがあります。階級幅・階級数をどのくらいにすればよいか悩みませんか? 私は結構いい加減に決めていましたが、目安になる方法2種類を説明します。Excelの分析ツールでヒストグラムを描く方法は過去ブログ「必ずヒストグラム」をご覧ください。
資料はこちら → ヒストグラム2
使用したExcelファイルはこちら → ヒストグラム2
220名の体重データがあります。私なら、Max78kg、Min18kgなので差が60kg、階級幅5kgぐらいかなとしてヒストグラムを描きます。階級数は15です。この220名のデータは、右下のようなグラフになるように故意に作成したデータです。 平均値と標準偏差を算出するだけではダメで必ずヒストグラムを描いてくださいねという事例です。 「スタージェスの公式」に基づいて計算すると階級数は約8となります。一方、経験的には、右下の表で決めると良いと言われています。この表からは、7~12という階級数になります。スタージェスの公式はこの表の中央値ぐらいですね。実際に、階級数を7、10で描いてみました。 階級数10ぐらいが良いと思われるのですが、私が意図したことは現れていませんね。 スタージェスの公式や表は、あまりに特異なデータには適さないのかもしれません。 次回は、統計ソフトMinitabではどのように描いてくれるか試してみます。自動で階級幅を設定してくれるのかな?