調べたいものの分布が、目標値や他の分布と異なるか同等なのかを調べたいことがあります。 この操作を「(統計的)検定」と呼びます。 今回は1つの標本についての検定を説明します。「標本」とは、調べたいためにサンプリングしてきた集団です。
先ずは資料をご覧ください。 → 統計的検定その1
p.2 分布は、「平均値」と「分散(ばらつき)」の2つの要素で決まります。
p.3 「検定」とは「比較によって母集団の様子を推測すること」です。 この「様子」が、「平均値」や「分散(ばらつき)」の状態を意味しています。 1標本の検定は、ある一定値と調べたい分布の平均値に差があるかないかを調べます。 右側の図です。 2標本の検定では、平均値あるいは分散(ばらつき)に差があるかないかを調べます。 青と赤の分布は分散(ばらつき)は同じ(等分散)ですが、平均値が異なります。 青とピンクの分布は、平均値が等しく分散(ばらつき)が異なります(異分散)。
p.4 検定にはいろいろな場合がありますので、ツリー図で説明します。今回は、1標本についてのツリー図です。 標本サイズが100以上か未満か、母集団が正規分布か否か、母集団の標準偏差が既知か否かにより、「Z検定」「t検定」あるいは「ノンパラメトリック検定」のルートに分かれ、計算式が異なります。
P.5、6 復習です。統計量の算出式覚えていますか?
p.8 検定に使用する分布です。 上の2つ「正規分布」「t分布」を、平均値の有意差を検定する「Z検定」「t検定」に各々用います。 ばらつきの検定は1標本の時は、「χ(カイ)2検定」あるいは「F検定」を用います。
p.9 1標本の検定を図にしたものです。例えば全国のラーメンの平均価格が600円だったとします。東京のラーメンの価格を100軒調査したところ、610~630円に分布していたとします。一方札幌の価格は100軒で590~610円でした。図をみると、東京の価格は全国平均より高く、札幌の価格は全国平均とは差がないように見えます。 この図が示すイメージを数値で判定することを「統計的検定」と言います。
p.10 「統計的検定」というと「帰無仮説」とか「対立仮説」という言葉が出てくるので、嫌悪感を持つ方が多いと思います。 通常、「差がある」とか「効果がある」ということを証明したいことが多いため、これを「対立仮説」として、その反対「差がない」「効果がない」を「帰無仮説」にします。決まり事だと思ってください。
p.11 検定の手順を上の枠内に並べました。帰無仮説は「東京(A)のラーメン価格の平均値μは全国平均(比較値)m0と差がない」とします。これに対して、対立仮説はa、b及びcの3つがあり得ます。対立仮説aは「差がない」、対立仮説bは「600円より高い」そして対立仮説cは「600円より安い」となります。各々「両側検定」「右側検定」「左側検定」と言います。右とか左とか言わずに「片側検定」という場合もあります。
p.12 ①に帰無仮説が書いてあります。全国を母集団とした際に、全国の標準偏差σが50円であることが既知であるとします。東京のラーメン屋100軒をランダムに調査して平均値が620円だったとします。 ②どのくらいの信頼度で検定するかを決めます。この信頼度を「有意水準」と呼びます。有意水準0.05とは、5%の確率で間違えても許容しますよという意味です。対立仮説を両側検定にする場合は、分布の右側と左側に2.5%、合わせて両側5%とすることが多いです。右あるいは左側だけをみる場合は、各々5%とします。この有意水準を決めるとp.14の正規分布表より「z値」が決まります。両側検定の時は、確率=0.5-0.025=0.475よりz=1.96、片側検定の時は、確率=0.5-0.05=0.45よりz=1.64となります。 ③620円を基準化して標準正規分布に変換した際の統計量を算出します。先日のブログ「同じ土俵に載せる」では、統計量=(数値ー平均値)÷標準偏差と記載していました。 本日のブログでは、「標準偏差」ではなく「標準誤差」で割っているのに気がつきましたか? 「σ」ではなく「σ/√n」で割っているのです。母集団ではなく、母集団からサンプリングした「標本の標準偏差」は「母集団の標準偏差σ」を「√n」で割った「標準誤差=σ/√n」になることを覚えておいてください。数値を入れて計算すると統計量T=4が得られます。 ④有意水準0.05のときのz値=1.64(片側)、z値=1.94(両側)が②で得られていました。統計量T=4は何れのz値よりも大きいが明らかです。 下の「標準正規分布曲線」をご覧ください。1.64以上が片側検定の「棄却域」で、統計量T=4は大きくはみ出ています。つまり「帰無仮説」は棄却されて、対立仮説b「平均価格は600円より高い」が証明されました。 統計ソフトの場合は「p値」が算出され、0.05より小さい値になるはずです。 つまり水色の面積0.05よりさらに小さいということで、0.05の確率的には起こり難い、つまり棄却されると同じ意味です。
p.13 基準化について数値を入れた図です。
p.15 標本のサンプル数が100未満で、母集団の標準偏差が未知の場合は「z検定」でなく「t検定」を用います。p.12の「z検定」と異なるところだけ説明します。サンプルが「n」ではなく「n-1」になります。母集団の標準偏差が不明な場合、「不偏標準誤差」の自由度はマイナス1にすることが決められています。 ②の有意水準は、「正規分布表」ではなく「t分布表」(p.16参照)を用いてt値を求めます。今回の自由度=サンプル数ー1=26-1=25ですので、赤枠がt値です。片側検定のt値=1.708、両側検定のt値=2.060となります。 ③統計量T=3 ④統計量T=3は、t値より大きいことより、p.12の説明と同様の結果となります。帰無仮説が棄却され、対立仮説が採択されました。
いかがでしたか? 「統計的検定」少しはイメージできましたか? 統計量Tが「有意水準から求めたz値あるいはt値」より右側あるいは左側にある場合は、帰無仮説が棄却されて、対立仮説が選ばれます。 基準化すると確率が求めやすくなり、正規分布表かt分布表で、閾値のz値かt値を求めます。 統計量Tと閾値の大小関係をみれば検定できるわけです。分布をイメージしてください。閾値との位置関係をイメージしてください。