データサイエンス トピックス 統計

ややテクニックが必要

投稿日:

昨日は、1因子分析でした。本日は2因子分析について説明します。

資料はこちら → 2因子分析

p.1 5つの変量x〜wについて、共通のFGという2因子から影響受けている場合が左下図です。求めたいのは、負荷量ax〜bwです。昨日同様に、変量x〜wは、共通因子FとGに負荷量の係数が掛かり、独自性誤差が加算した式になります。右下図のように、各々は独立していて相関は無いとし、共分散の式は全てゼロとします。

p.2 標準化するので、分散は1となります。共分散は相関係数と等しくなります。左下図をご覧ください。変量x〜wについて、aとbの和共通性水色の部分で1からこの部分を指し引いた部分が独自性の誤差です。このあとaとbを求めますが、手計算では困難です。そこで、水色の部分は、決定係数R2=(目的変量の予測値の分散)/(目的変量の実測値の分散)と等しいとして進めます。

p.3 決定係数は、重回帰分析を用いて算出します。例えば数学の決定係数は、数学を目的変数、他の教科を説明変数として重回帰分析を実施します、Excelの分析ツールの「回帰分析」を用います。実行結果の赤枠内の数字が決定係数です。同様に、他学科についても各々目的係数として決定係数を算出した結果が、右上表です。 各学科間の相関係数を求めて、左下のマトリックスを作成します。次は、分散共分散行列理論に合うように近似するため、誤差の平方和式Qを立てます。最小二乗法と同じ考え方です。この誤差Qが最小になる負荷量ax〜bwをExcelのソルバーで算出します。

p.4 ソルバーを用いる前準備として、相関行列の対角に決定係数を代入した因子決定行列RFを作成します。このRFと、因子負荷行列とその転置行列積の行列差の平方誤差Qです。Excelのソルバーを用いて、Qが最小になる因子負荷行列Aを求めます。求めた結果を右図に数値として書き込んでおきます。

誤差Qの式を立てて負荷係数を算出するテクニックは知らないと分析できないと思います。統計ソフトは、まだ試していませんが、もっと簡単に分析してくれるかもしれません。ただ、原理的なところは一度は知っておく必要があると考えます。

-データサイエンス, トピックス, 統計

Copyright© 進化するガラクタ , 2025 All Rights Reserved Powered by STINGER.