先日「相関が良すぎてもダメ」で「多重共線性」は避けた方が良いという話をしました。つい最近「マハラニビス・タグチ(MT)システムのはなし」(著者:長谷川良子 発行所:日科技連)を読んでいたら、分かり易い絵が載っていました。以下に描き直してみました。この本読み易いので、是非読んでみてください。
この図です → 多重共線性その2
上の図は、曲がった流路の入口と出口に性能が同等のセンサAとBがあります。センサは温度、圧力あるいは流量何でも構いません。センサAとBの出力が同じ場合、相関係数が1なので多重共線性となります。 下の図はセンサ1~3の出力の和がセンサ4の出力になる場合にも多重共線性となります。この場合も、複数の項目間の相関係数が1となります。 いずれの場合でも、等号ではなく不等号になるとどこかに異常が生じることを示唆しています。漏れ等があると推測できます。 相関が良すぎる情報があると、その分、有用な情報が減ってしまう訳です。