トピックス 統計

数値でなくても相関をみるためには

投稿日:

どう整理するか?」で「ダミー変数」を取り上げました。もう少し掘り下げてみます。アパートの家賃が方角に依存して場合、どのように解析するかについて説明します。

資料はこちら → ダミー変数

p.1 実際の家賃は、部屋の広さ、築年数、駅からの時間などの要素などで決まりますが、今回は、簡単のため、方角に対する家賃データを用います。例えば、東西南北の数字を当てはめて東:1,西:2、南:3そして北:4として、回帰分析を実施します。解析結果を中ほどに示します。方角をx軸に、家賃をy軸にした際の近似式の勾配切片係数として計算されます。また、この近似式を用いて予測額を算出後、実際の家賃との差を残差として計算されます。図にしてみるとわかり易いですが、「東西南北の1~4の順番で家賃が単調増減していないので、回帰式で予測できない」ことがわかると思います。方角のp値が0.5以上のため、「相関があるとは言えない」ということを示しています。

p.2 ダミー変数として、該当する項目を1,それ以外を0とします。例えば、0:東以外、1:東とします。他の方角も同様にしたデータが左表です。東西南北4つを用いた場合と、北を除いた3つについて重回帰分析を実施した結果を示します。係数p値をご覧ください。ダミー変数が4つの場合、4つ目の係数及びp値は計算不能となります。理由は「多重共線性」のためです。4つ因子がある場合、3つの因子が決まれば、最後の1つは自動的に決まるため、ダミー変数の数=パラメータの数-1とします。自由度と同じですね。「多重共線性」を知りたい方は、「相関が良すぎてもダメ」をご参照ください。

p.3 方角を1変数とした場合と4変数にした場合の結果を示します。ダミー変数を用いた方が、①東西南北個々に家賃との相関関係がわかり、重回帰分析で得られた残差も小さいことが明らかです。

重回帰分析において数値化できないパラメータについても、ダミー変数を用いることで相関関係を調べたり、予測値を算出することが可能になります。

 

-トピックス, 統計

Copyright© 進化するガラクタ , 2024 All Rights Reserved Powered by STINGER.