統計に用いるワークシート第2弾で、分散分析を取り上げます。分散分析は、因子が複数あったり、繰り返しデータがある場合に因子間に有意差があるのかないのか、繰り返しのデータ内での誤差はどうかなどを調べるツールです。分析ツールや統計ソフトのフォーマットに従って間違いなくデータを入力すれば、結果はあっと言う間に得ることができますが、分散分析の「からくり」を理解することが重要であると考えます。 この分散分析でも「平方和」や「分散」が活躍するのです。分散分析についての説明は過去ブログ「実験の効果を判定するには」「ここでも平方和が活躍」「統計学習は自転車乗りの練習と一緒」をご覧ください。ここでは、ワークシートの使用方法を説明します。
ワークシートのExcelファイルはこちら(統計用ワークシートにも保存しました) → 分散分析ワークシート
一番下にあるシート名をご覧ください。 「○○_ワーク」と「○○_実行結果」で一組です。ワークシートの黄色は空欄になっていますので、計算式を入れてください。不明な場合は、実行結果のセル内をご覧ください。 手計算が済んだら、分析ツールの分散分析を実行し、手計算の値と一致しているかをご確認ください。
Excelの分散分析は二元配置までしかありませんが、手計算であれば三元以上も可能です。あまり多くなり過ぎた場合はマクロを作成するか、統計ソフトを頼ることになります。 ただ今回の目的は分散分析の「からくり」を理解することです。全変動=効果変動+誤差変動という関係で、変動に平方和を用いているのです。変動は全体平均あるいは因子内平均からの偏差を用いています。変動を自由度で割った値が分散、その平方根が標準偏差となる訳です。 この分散分析は、品質工学でも利用されています。 手作業で統計を学習する癖をつけましょうね。