「いい加減に覚えると後が大変」で決定係数と相関係数の違いを説明しました。忘れた方は、再度ご確認ください。以前、決定係数の説明用の図を入れておきましたが、もう少しイメージし易い図がありますので、評価指標の説明と併せて紹介します。
資料はこちら → 評価指標その1
p.1 回帰モデルの良し悪しを評価する指標を表にまとめています。MAE、MSE、RMSEと寄与率(決定係数)の算出式と意味をまとめています。統計では絶対値のMAEよりも平方和のMSEを用いますし、MSEの平方根であるRMSEは標準偏差そのものですね。既にみなさんご存知の値です。寄与率も決定係数として上述のブログで算出式の導出をしています。左下図を用いて説明しました。今回、右にある2つのグラフをご覧ください。こちらの図の方がイメージがつき易いです。算出式の分母は真ん中の図のように各データの値から全てのデータの平均値を差し引いて2乗して合計したものです。算出式の分子は、各データの値から回帰直線の推定値を差し引いて2乗して合計したものです。分子がゼロになれば、つまり全てのデータが回帰直線上にあれば、決定係数は1となり、データは完全に回帰直線に合致します。今回、回帰直線で説明しましたが、回帰曲線でも良いのです。相関係数は直線にしか適用できません。
p.2 以前の資料の再掲です。
決定係数の意味をイメージし易い図で覚えておくと理解が深まります。