実験計画法について、「苦労する割には‥‥」「どちらが効くの?」などで取り上げてきました。原理的なことはわかるが、実際にどのように使うかわからない方が居られると思います。Excelを用いて、実験計画法の手順を説明します。
資料はこちら → 実験計画(Excel)
p.1 2水準系(L8)直交配列表実験の事例です。3水準系でも考え方は同じです。8行の実験結果が、右端のデータです。一番上の行の「B A A✕B C B✕C D」は要因と交互作用です。今回検討する要因は「A B C D」の4項目と、「A✕B」「B✕C」の2つの交互作用です。次に、真中の表をご覧ください。「第1水準の和」は、列ごとに水準「1」のデータの合計、「第2水準の和」は、列ごとに水準「2」のデータの合計です。列平方和は、(第1水準の和−第2水準の和)2/データ数で算出します。 次に下の分散分析表を作成します。統計ソフトや分析ツールでも作成可能ですが、できるだけ手作業で作成することをお勧めします。 分散分析表のS(平方和)は、上述の列平方和の数値を該当の列から引当ます。各要因及び交互作用の自由度φは水準が2個なので2=1−1=1となり、総和平方の自由度はデータの数8マイナス1で7になります。分散Vは、 S(平方和)÷自由度φ、F0(分散比)は、各分散Vを誤差分散VEで割って算出します。p値は「=F.DIST.RT(F0, 自由度ϕ,誤差の自由度ϕ)」F値は「=F.INV.RT(0.05,自由度ϕ,誤差の自由度φ)」で算出します。この算出法は、「相手を知らないと判断できない」と全く同じで、復習です。F値はF分布のp値になるかならないかの「しきい値」のことです。このしきい値より右にあればp値が0.05以下になります。
p.2 p値の列の数値をみて、プーリングする行を決めます。今回は、交互作用B✕Cの行の平方和と自由度を誤差平方和の列に加えます。V〜F値の列について再計算した分散表が下表です。効果が現れるようになりました。
p.3 最適水準を求めるために、各要因のデータの合計を算出します。交互作用のあるAとBについて、二元表にまとめます。A1B2について代表して説明します。「=SUMIFS(データの列,要因Aの列"=1",要因Bの列,"=2")」を用いて、A1B2となるJ列のデータを合計して、「53」を得ます。他も同様です。二元表の最大値は「53」です。要因CとDの最大値は、「78」「87」となり、最適水準の組合せは、「A1B2C2D2」です。
p.4 真中下の表の数値を計算していきます。点推定は最適水準の各要因の平均値を足した値からデータの平均値を差し引いた値です。「t分布5%点」はt分布のp値が0.05になるt値を算出しています。「=T.INV.2T(0.05,誤差の自由度φE)」にφE=2を入れて計算して4.30が得られます。有効反復数の逆数は、各自由度と総データ数を用いて算出します。以上のデータより信頼区間の幅が算出され、点推定に±して信頼区間の上限、下限値が求まります。
p.5 予測区間を算出しています。右下のように式中に誤差分散VE分が加算されます。詳細は、過去のブログ「回帰曲線の信頼区間、予測区間とは?」をご覧ください。
いかがでしたか? 実験計画法を実施する場合、ここまで解析しなければ使ったことにならないのです。統計ソフトに任せたら、最適水準を見つけてくれないかもしれません。予測区間の算出もしてくれるでしょうか?プーリングを自動でしてくれるでしょうか? プーリングをしなければ、効果がないという結果で終わらせてしまうかもしれません。
今回使用したExcelファイル → 実験計画(Excel)