分散分析については、何度か取り上げてきました。今回は、統計ソフトに頼らず、Excelを用いた手作業で分散分析表を作成してみます。Excelの分析ツールはMinitabのような統計ソフトを使用すれば簡単なのですが、交互作用の意味を知るには、手作業の方がよいと考えます。今回は、この交互作用にスポットを当ててみます。
資料はこちら → 分散分析事例
今回使用のExcelファイル→ 分散分析事例
p.1 繰り返しのある一元配置分散分析から始めます。成形温度がA1~A3の3条件について各々4個のサンプルの耐圧強度yを計測した結果について分析します。全てのデータの平均値をTバーとし、各々のデータのTバーからの偏差を求め、その平方和を算出したものが全変動STです。A1~A3各々の条件の平均値とTバーの差が、Aiの効果です。Aiの平方和が効果変動SAです。各々のデータと各条件の平均値の差分が誤差で、これらの平方和が誤差変動Seです。左下に数式を載せておきます。自由度は、右上表の下のように求めます。計算した結果を右上の分散分析表に書き込みます。分散Vは平方和Sを自由度で割った値です。分散比は、VAをVeで割った値で、検定の際には有意差が生じるF分布の閾値との大小関係を比較します。この事例で有意水準0.05、自由度2の閾値は4.256(=F.INV.RT(0.05,2,9))と計算され、分散比8.651の方が大きいことより、帰無仮説の棄却域にありますので、成形温度の効果は有意であると判断できます。p値も0.05以下なので同様です。一元配置分散表(右上)だけでは、この程度の情報しか得られません。左表の各条件の平均値を見ると、A3が最良の水準であることがわかります。統計ソフトの解析結果で有意差を見るだけでなく、どの条件(水準)が効果があるかを見るのも重要な情報です。
p.2 繰り返しのない二元配置分散分析の事例です。上述の説明と同様な手順で計算します。一元配置分散分析と異なる点は、因子Aと因子B各々の効果について計算しています。
p.3 繰り返しのある二元配置分散分析の事例です。上述の2例と異なるのは、因子AとBの交互作用の影響を考慮することです。左下の各因子の平均値を計算しています。AiBjバーが交互作用の平均値です。計算方法は、上述の事例とほぼ同じです。右上の分散分析表のようになります。交互作用の自由度は、AとBの自由度の掛け算です。p値の見方は同じです。この事例の場合は、A3B1の効果が最良であることがわかります(赤枠)。
p.4 左表がp.3で得られた分散分析表です。交互作用A✕Bのp値が0.05より大きいことより有意であるとは言えないため、交互作用A✕Bの自由度f及び平方和Sの数値を誤差eのセルに加えてまとめます。誤差e'の分散値が変更されるので、分散比やp値も変更されます。以上の操作をプーリングと呼びます。
分散分析については「統計のからくりは手作業で」、プーリングについては「相手を知らないと判断できない」も合わせてご覧ください。