決定係数R2については、「いい加減に覚えると後が大変」で取り上げてきましたが、イメージが湧かなかったとおもいますので、図を使ってリニューアルしました。
資料はこちら → 決定係数 その3
p.1 このグラフをイメージしてください。i番目のデータが(xi、yi)として、近似した回帰直線が求められます。全てのyiの平均値をyバー、回帰式上のyの値をyiハットとします。全変動、回帰変動及び残差変動は図中の式で表され、全変動=回帰変動+残差変動となります。決定係数の意味を最上段に言葉で示します。決定係数は、➀回帰変動が全変動に対してどれだけ多いか、あるいは②残差変動が全変動に対してどれだけ少ないか のどちらの表現でも構いません。したがって、残差変動がゼロに近づけば決定係数は1に近づきます。決定係数の算出式は、右上の2式のいずれかになります。実際の計算では、全変動、回帰変動および残差変動は平方和で計算します。
p2. 実際の値を用いて、Excelで計算させてみました。p.1の式に代入して算出して、手計算すると、Excelの近似式で求めたR2と同じ値になることが確認できました。難しい式の導出をせずに、大まかなイメージを持つことが大事であると思います。Excelの近似式で表示させた決定係数R2の意味合いも少しは理解できるようになると思います。