多変量解析の中から「因子分析」について勉強しており、資料にまとめました。
資料はこちら → 因子分析
p.1 因子分析には「探索的因子分析」と「確認的因子分析」があります。前者は、各因子の共通因子の意味を仮定しないで分析後、意味を考える分析であり、後者は意味を仮定後、分析する手法です。今回は、「探索的因子分析」の事例です。左表は、各県の人口、旅券発行と婚姻率のデータです。人口、旅券発行と婚姻率を変数x、y及びzとします。3つの変数に共通な因子をFとおくと真ん中下図のようなベン図が描けます。右上の式のように各変数は、Fに因子負荷量a、b及びcが掛かり、独自因子ex、ey及びezが加算されています。
p.2 式の導出なので、p.3に読み飛ばしても結構です。xの分散とxyの共分散の式を立てます。p.5に詳細な導出を載せておきます。流れだけ見てください。次に、右図のようにF、ex、ey及びezの各因子は相関関係がないと仮定します。するとお互いの共分散は0となります。相関係数の分子が共分散であることを思い出してください。xの分散とxyの共分散の式は、短縮されます。更に、データを平均値と標準偏差を用いて「標準化」して、さらに簡略化すると共分散は、Sxy=ab、Syz=bc 、Szx=caとなります。
p.3 左表のデータを標準化して、Sxy=ab、Syz=bc 、Szx=caを算出します。各々共分散ですので、Sxy=abは、Excel関数「=COVAR(緑枠,ピンク枠)」を用いて算出します。Syz及びSzxも同様に求めます。次にab×bc×caよりabcを求め、a、b及びcが求まります。右上図のようにx、y及びzの共通因子Fに関する因子負荷量a、b及びcを数値で示しています。
p.4 因子Fが説明する分散が全分散に対する寄与率を算出します。a2+b2+c2が 因子Fで説明する分散に相当します。左上の図と式を見比べてみれば、意味がわかると思います。
p.5 式の導出です。
これらの結果から、共通因子Fの意味を考えます。人口、旅券発行と婚姻率に共通する因子とは、何でしょうか? 「地域活性度」を表しています。