先週に引き続き統計事例の説明です。本日は、パラメトリックとノンパラメトリック検定の説明から入ります。
資料をご覧ください。 → Z検定
p.1 パラメトリック検定は、母集団の正規分布がわかっていたり、N数が十分多い場合に用い、Z検定やt検定があります。母集団が正規分布で標準偏差σが既知の場合は「Z検定」、σが不明でN<100の場合は「t検定」となります。 母集団が正規分布かどうか不明の場合や、N数が少ない場合はノンパラメトリック検定を用います。ノンパラメトリック検定については、後日説明します。正規分布か否かは「Shapiro-Wilk(シャピロ-ウィルク)検定」を用いるか、以前のブログ「見てわかる?」で説明した「正規確率紙」を用いて判定します。これも後日、説明します。
p.2 N数が100以上のZ検定の事例です。ある電化製品を5点満点で評価した結果が男女別に得られています。男女間で評価に差があるかを検定します。帰無仮説は「男女間の評価は同じ」です。 今回は数値が全て明らかなので統計量Tを代入して計算して7.26が得られます。棄却域の閾値Z値は正規分布表より両側検定では1.96が得られます。統計量T=7.26>1.96なので、帰無仮説は棄却され、男女間の評価は異なると判定されます。
p.3 正規分布表です。有意水準0.05は、両側検定の場合片側が0.025となり斜線部分は0.5-0.025=0.475(赤い枠)。よって閾値のZ値=1.96が求まります。Excel関数は「NORMSINV(0.975)」で求まります。
p.4 統計ソフトMinitabで実行してみます。 ①統計→基本統計→2サンプルt(2)と進みます。Z検定は見当たらず、2サンプルt(2)を選択します。今回はデータが既にありますので、「要約データ」を選択して③入力します。④クリックすると実行結果が得られます。先週のt検定と同様p値をみて判定します。p値=0.000<0.05なので有意差ありと判定します。T値=7.26の記載がありますが、閾値Z=1.96の記載がないので、p値で判定するしか方法がありません。
少しMinitab操作法慣れてきましたでしょうか? 通常統計で使用される語句でなかったり、閾値の記載がないなど、多少不具合はありますね。