データサイエンス トピックス 統計

アンケート結果の検定は・・

投稿日:

クロス集計結果について、独立性の検定としてカイ二乗検定を用いる方法を説明します。以前ブログ「χ2検定の適用例は多い!」でも取り上げていますが、今回「クラメール」という関連性を評価する数値を利用する事例を取り上げました。

資料はこちら → クラメール

p.1 若者高齢者A、B及びC広告案を見せて好む案を選ぶアンケート調査の結果に示します。「年代」と「好む広告案」が関連しているかどうか あるいは 「年代」「好む広告案」のクラメールの連関係数が0より大きいかどうかについて、有意水準0.05で検定せよという問題です。帰無仮説は、「年代」「好む広告案」のクラメールの連関係数が0に等しい です。*クラメールの連関係数は、次ページで説明します。

p.2 3つの表の上から計算していきます。1つ目は、実際のアンケート結果です。2つ目は、期待度数を算出しています。例えば、C案を選択した若者の期待値を算出します。若者全体148人に、全員300人のうちC案を選んだ人の割合を掛けることにより、62.7人の若者がC案を選ぶことが期待されます。実際は53人でしたので、思ったよりはC案を選択しなかったようです。同様に他のセルの期待値を算出します。3つ目の表は、(実測度数-期待度数)/期待度数を計算します。期待度数からどれだけズレたかを評価しています。全てのセルの合計値が、ピアソンのカイ二乗統計量χです。

p.3 クラメールの連関係数は、前述のピアソンのカイ二乗統計量及びクロス集計表の行と列の数を用いて算出します。算出結果は、下表と比較して関連性を判断します。

p.4 今回事例の自由度は「2」のカイ二乗分布に従います。有意水準0.05閾値を、Excel関数「CHIINV(確率,自由度)」で算出すると「5.991」、χ=7.821と比較すると、棄却域にあることわかります。p値も0.05以下です。よって、帰無仮説「クラメールの連関係数が0に等しい」が棄却され、クラメールの連関係数が0より大きい(関連性あり)と結論付けられます。今回は、計量データでなく計数データの検定を実施してみました。

 

-データサイエンス, トピックス, 統計

Copyright© 進化するガラクタ , 2025 All Rights Reserved Powered by STINGER.