統計に用いるワークシート第3弾で、重回帰分析を取り上げます。重回帰分析については、過去ブログ「適正価格は勘で決める?」でExcelの分析ツールを用いて説明していますが、今回は手作業を念頭にExcelのワークシートを作成しました。先ずは、説明資料をご覧ください。
説明資料はこちら → 重回帰分析
ワークシートのExcelファイルはこちら → 重回帰ワークシート
ワークシートは、こちらにも保管してあります → https://evolvingbook.com/worksheets/
p.1 パラメータがx1とx2の2つの場合の係数β0、β1およびβ2を求めて回帰式を得る概念を述べています。xy平面での最小二乗法と原理は全く同じです。xy平面の場合は回帰直線からの偏差の平方和が最小になる係数を求めました。今回は3次元空間ですので、回帰平面からの偏差の平方和が最小になる係数を求めることになります。偏微分=0とおいて、連立方程式を解いていきます。この際に、網掛にある偏差平方和、積和および偏差積和を用いて連立方程式を簡略化すると、行列で表すことが可能になります。
p.2 パラメータが複数の場合ですが、2つの場合の拡張になります。これも連立方程式は行列の形になります。係数βの行列を求めるには、Sの逆行列S-1を掛けると得ることができます。
p.3 分析ツールや統計ソフトを用いればあっという間に計算してくれますが、今回は手作業の手順を順を追って説明します。Excelのワークシートを見ながら読んでください。①先ずは偏差平方和を求めます。x1~x4のデータから平均値を引いて偏差を求め、各々の列の偏差平方和を求めます。
p.4 積和を求めます。6通りの全ての組み合わせの和を計算します。手作業では、やや面倒ですが、そう感じることも大事です。
p.5 偏差積和を求めますが、これは相関係数のところで説明した共分散のことですね。
p.6 偏差平方和、積和および偏差積和が出揃いましたので、この行列の逆行列を求めます。
Excelで逆行列を求める方法を説明します。①逆行列の結果を入れる領域を指定、②数式 MINVERSEを選択、③変換したい行列範囲を指定、④OKクリックせずに「Shift + Ctrl + Enter」を押します。この手順で逆行列S-1を求めます。
p.7 逆行列を偏差積和の行列をかけて係数の行列を求めます。β1~β4まで得られましたので、回帰式にデータx1~x4およびyの平均値を入れてβ0を求めます。
p.8 分析ツールを用いた重回帰分析の手順です。以前のブログ「適正価格は勘で決める?」の再掲です。
p.9 手作業の実行結果と分析ツールの実行結果を比較します。β1~β4については、ほぼ同等の値ですが、β0は差が大きいですね。分散分析表の標準誤差の赤枠内の数値が大きいことがばらつきが大きいことを示しています。
パラメータが多くなると行列計算になるため、手作業が面倒なことが体験できたと思います。ただ、手作業を実行してみると、重回帰分析は平面での最小二乗法の拡張であることを理解していただけたのではないでしょうか。また、ここにも平方和や共分散が登場してきますね。