トピックス 統計

分布形状は平均値と○○で決まる

投稿日:

昨日のブログで計数値は整数と言う説明をしましたが、間違っていましたので、「不連続な数値」と訂正しておきました。例えば、分子が不良数、分母が製品数として計算した不良率も計数値だそうです。分子が製品数、分母が時間の場合は計量値となるそうです。分子、分母が何れも計数値の場合は計数値何れも計量値の場合は計量値何れか一方が計量値の場合は計量値となるようです。例えば、単位時間当たりの生産数や、一人当たりの学習時間は計量値となるようです。本日たまたまQC検定のテキストを読んでいたら気が付きました。

本日の本題です。χ(カイ)検定分散の検定に用いる事例を説明します。

資料ご覧ください → 分散の検定

p.1 正規分布の母集団よりサンプリングしてきた標本の分散はn数に関わらず自由度n-1のχ2分布に従う性質があります。ある標本のサンプル数分散をかけて母分散で割った統計量Tを算出すると、その標本が母集団と等しいか否かを判定することができます。 2つ目は2つの集団の分散が等しいかどうかを検定するF検定です。 2つの集団の分散はχ2分布に従い、自由度で除した値の比はF分布に従います。この比を統計量として閾値と比較するのがF検定と呼びます。

p.2 母分散の検定の事例です。問題文をお読みください。旧製法の集団を母集団として母分散は既知になります。新製法の部品の標本サンプルの分散を調べて、母分散に等しいという帰無仮説を立てます。対立仮説は、新製法の分散が302より小さいとします。統計量Tに値を代入してT=20.97有意水準0.05・自由度39閾値25.70比較して小さいので帰無仮説は棄却されます。閾値よりTが小さいので、新製法と旧製法の重量ばらつきは等しくはなく、新製法の方が小さいと判定されます。

p.3 χ2分布表から閾値を求めます。 Excel関数は「CHIINV(39,0.95)」で得られます。

p.4 Minitabの実行例です。①から④まで順番に進んでいくと実行結果が得られます。今回、母分散の検定がMinitab内のどこにあるか探すのに苦労しました。p.5のF検定は「2サンプルの分散」を用いればよいので分かり易いですが。新旧2つの集団があるので2サンプルという処理をすればよいという思い込みがありました。「1サンプルの分散」にして、②のところで仮説標準偏差を選択して、母集団の標準偏差30をインプットすると解析できます。つまり旧製法の母分散を既知として標本を1つのサンプルとして検定すればよいのでした。実行結果はp値と0.05の大小関係で判定します。 この判定は、もう慣れましたか?

p.5 2つ集団の分散が等しいかどうかをF検定でみる事例です。p.2に似ていますが、今回は「2サンプルの分散」になります。A及びB工程の分散の比が統計量T=3.41となります。分子が分母より大となるように計算します。p.6のF分布表で2つの自由度より閾値を求め9.36を得ます。T=3.41<9.63なので、帰無仮説は棄却さません。よってA及びB工程の分散に有意差は認められないと判定されます。

p.6 F分布表です。Excel関数は「FINV(0.025,5,4)」で算出します。

p.7 Minitabの実行手順です。「①統計→基本統計→2サンプルの分散」と進んでいくと右図のグラフが得られます。

p.8 前ページの実行結果です。これもp値が0.05との大小関係で判定します。

いかがでしたか? 分布は平均値と分散で形状が決まりますね。2つの集団が同等であるか否かは、分散の検定平均値の検定を実施する必要がある訳です。

 

-トピックス, 統計

Copyright© 進化するガラクタ , 2020 All Rights Reserved Powered by STINGER.