トピックス 統計

対象が異なる分布の比較は?

投稿日:

昨日に引き続き、t検定の事例です。 今回は対応がない2つの分布の平均値を比較します。では早速資料をご覧ください。

資料はこちら → 対応のないt検定

p.1 今回は2つの分布の構成要素は対応がありませんサンプル数は100未満です。

p.2,3 ある小学校の1年生の男子と女子の身長をランダムに計測して差があるかどうかを検定します。男子の平均身長が女子より高いかどうかを検定します。この「高いかどうか」という言葉に注意ください。この場合は、片側検定になります。「低いかどうか」の場合も片側検定です。「差があるかどうか」であれば両側検定となります。今回の場合、サンプル数が異なっていますので、自由度を下にある複雑な計算式で算出します。男子、女子について、平均値、分散を算出します。分散の計算方法は大丈夫ですか? 男子の身長の平均値が120ですね。 分散={(124-120)+(120-120)2+(122-120)2+(116-120)2+(118-120)2+(120-120)2}/(6-1=8ですね。今回は標本から不偏分散を求めるので、分母はn-=6-=5となります。 統計量Tの式に代入して4.9が得られます。 今回は片側検定ですので閾値t(f、α)=t(6、0.05)=1.943となります。p.3のt分布表から求められます。昨日、言い忘れましたが、Excelでは「両側検定: TINV(確率,自由度)、片側検定: TINV(2×確率,自由度)」で計算可能です。統計量T=4.9>閾値t=1.943なので、平均身長が等しいという帰無仮説が棄却され、片側検定なので「男子の平均身長が女子のそれよりより高いといえる」と言う判定になります。 右上の分布図を見れば、平均値や分散が男女でかなり違うことが明白ですが、数値で判定するのが検定です。

p.4 Minitabの実施手順です。「2サンプルt検定」を選択する以外は、昨日と同様に進めます。

p.5 実行結果です。グラフは2つの分布を表しています。これを見ても明らかの平均値は異なっています。右下の検定結果をご覧ください。赤枠内のp離0.05よりかなり小さい0.003なので、明確に平均値が離れている事がわかります。

p.6 Excelでの実行結果です。分析ツールで選択して順次進めていった結果が、下の表です。見方は昨日と同様ですが、今回は片側検定ですので、1.943を選択します。

いかがですか? 少し慣れて来ましたか? どれを選択するかは検定したい対象を考慮することですが、慣れも必要です。

-トピックス, 統計

Copyright© 進化するガラクタ , 2020 All Rights Reserved Powered by STINGER.