統計の事例を少しずつ説明していきます。 統計ソフトMnitabやExcelの分析ツールも合わせて手順を示します。以前同様な話をしたかもしれませんが、繰り返し見ることで習得できると思います。本日は、対応がある場合の2つの分布の平均値を比較します。
資料をご覧ください。 → 対応のあるt検定
p.1 対応があるとは、同じサンプルについて、データが1対1で対応している場合です。例えば、数名の被験者について投与前後で薬の効果があるかどうかを検定する場合に用います。t検定は、サンプル数が100未満や対応がある場合に平均値を比較する手法です。
p.2、3 ランダムに10名を選定して、投与前後の体温に差があったかどうかを検定します。統計ソフトがない場合、手計算で求める場合の考え方を述べます。帰無仮説は、投与前後に体温の差がないとします。つまり投与前後の体温差の平均値が0に近いのか離れているかを有意差として有意水準5%(5%の間違いは許容)で判定することにします。先ず投与前後の差を算出します。その差の平均値は0.44です。左下の表をご覧ください。A~Jの投与前後の差より0.44を差し引き、その平方和とその平方根を算出します。それを√n(n-1)で除します。この値で0.44を割ると基準化した統計量T=2.34が計算できます。これを有意水準5%で判定するための閾値をt分布表(次ページ)から求めると2.262となります。有意水準5%を2で割って、両側に2.5%(0.025)の列を見ます。自由度f=10-1=9となります。先ほどの統計量T=2.34は閾値t=2.262より大きい、つまりp.3の斜線部分(両側の場合は左にもあります)に含まれることがわかります。つまり帰無仮説(平均値が0)は棄却されました。投与前後の体温差には差があると判定させました。
p.4 Minitabで実行してみましょう。①Minitabを起動後、データを入力します。②統計→基本統計→対応のあるt検定 をクリック、③サンプル1と2のデータ列を選択、④オプションをクリックし⑤仮説差をゼロとします。上述の帰無仮説の平均が0のことを意味します。対立仮説は帰無仮説ではないことを意味します。p.3のt分布の斜線部分にあることを意味します。つまり、投与前後の体温差の平均が0にある分布(帰無仮説の分布)内にはないことを示します。⑥グラフは全てレ点を入れてOK、⑨OKをクリックします
p.5 実行結果です。 3つのグラフを描かれますが、どれも同じことを示しています。説明し易いグラフを選んでください。何れも、95%の信頼区間から外れたデータが幾つかあることを示しています。 右下をご覧ください。t検定結果です。赤枠部分のp値=0.044が0.05以下となりました。p.3の斜線部分が両側合わせて5%つまり0.05ですので、0.044はこの斜線部分に含まれることを意味します。 つまり、帰無仮説は棄却され投与前後の温度差があると判定されました。
p.6 Excelの分析ツールで同様に実行してみます。①→②の手順で実行すると下の結果が得られます。統計量T(表ではt)と閾値t(表では境界値)との比較あるいはp値と0.05との大小関係で判定します。 上述と同様な結果が得られます。
統計ソフトは途中経過がなく、いきなり結果が現れます。 皆さんには、できるだけp.2と3で実施している内容を理解して欲しいと思います。直ぐにはイメージできないかもしれませんが、何度も説明します。実際の分布を標準正規分布になるように基準化(標準化)して統計量を算出して、同じ土俵上で分布同士を比較するのです。