統計では量的なデータを扱うことが多いですね。アンケート調査結果を分析したい場合、数で表現することはできますが、相関関係をみたりすることは難しいですね。以前「アンケート結果の解析」で紹介した手法をもう少し取り上げてみたいと思います。本日より数量化という手法を説明します。 資料をご覧ください。
資料はこちら → 数量化Ⅰ
p.1 アンケート結果はカテゴリで得られるデータが多いです。数値(量)的なデータに対して質的なデータと言えます。 この処理は主に4つの手法が使われています。説明変数を横軸にして目的変数を縦軸にして回帰分析を行いますが、この際は説明変数及び目的変数が数値(量)データです。説明変数をカテゴリ(質)データで回帰分析する手法が数量化Ⅰ類、目的変数もカテゴリーの場合が数量化Ⅱ類と呼びます。目的変数つまり外的な基準がない場合は、数量化Ⅲ類となります。目的及び説明変数が明確でない場合、数量化して親近度を評価する方法が数量化Ⅳ類と呼びます。順次説明していきます。
p.2 数量化Ⅰ類の事例です。芸術についての関心度アンケートの結果が下表です。質問1と2はカテゴリデータ、質問3は数値(量)データですね。 これをどのように解析したらよいでしょうか?
p.3 左上の表を細分化し、右上の表のようにスコアを計算します。x1,x2,y1及びy2が重回帰分析の係数に相当します。残渣平方和Seを計算します。娯楽からスコアを差し引いた値の平方和がSeです。
p.4 Excelのソルバーを用いてSeが最小になるように赤枠のセルを変数にします。最初は、適当に1,2,3という数値を入れておきます。x1を0に固定した理由は、変数を減らしてソルバーが収束するようするためです。解析した結果が下表の赤枠内の数字です。重回帰分析の係数に相当しますので、数値が大きいほど影響力が大きいのです。この数値を棒グラフで示しました。この結果、年齢差よりも関心の有無が娯楽費に投資する額に影響していることがわかりました。
いかがでしたか? 説明変数がカテゴリーでも回帰分析が可能なことがわかりますね。