深堀してみました

投稿日：2021年1月29日

検定の話をした際に検出力という単語がでてきたはずです。以前の資料で「（1－β）検出率」と記載されていましたら、「1－β）検出力」に訂正しておいてください。本日は、検出力について少し掘り下げます。資料をご覧ください。過去の関連するブログは「「あわてもの」と「ぼんやりもの」の誤り」

資料はこちら　→　検出力

p.1　上述の過去ブログの資料の一部を再掲します。正常人とガン患者の分布の検定の際に、できるだけ間違いがないように検定したいですね。どれだけ確からしく検定するかの尺度が検出力（1－β）です。大きいほど検出力は上がります。

p.2　この図も同じ資料にあったグラフを載せています。この図は、２つの分布の平均値が離れているか、標本のサンプルサイズが大きいほど検出力が上がることを示しています。

p.3　検出力を上げる要因として、平均値の差とサンプルサイズがあると上述しました。　これを整理します。検出力は①有意水準α、②効果量　及び③サンプリングサイズに影響されます。何れの要素も数値が大きいほど検出力は高まる方向になります。②と③はOKとして、①が大きいのは困りますね。間違える確率が高まるということですから。　そこで、目安として検出力は0.8以上あれば良しとするのが一般的です。　有意水準と効果量を決めればサンプルサイズを算出することが可能です。p.5で説明します。

p.4　効果量とは、一言で言うと2つの分布の各々の平均値の差を標準偏差で割った値です。言い換えれば、基準化した際の、２つの分布の各々の平均値の差です。2つの分布が対応している場合、ない場合及び分散分析における効果の算出式をまとめておきます。

p.5　この資料も上述ブログの資料の一部ですが、右上の黄色部分を追加しました。検定の際のサンプリングサイズの算出式です。Z_（1－α）は、例えば有意水準α＝0.05の時は1－0.05＝0.95の境界値を標準正規分布表から求めたZ値です。Z_（1－β）は、例えばβ＝0.1の時は検出力β（1－0.1）＝0.9となる境界値を標準正規分布表から求めたZ値です。Δμは２つの各々の分布の平均値の差です。この式を見ると、p.3で述べたように、有意水準・効果量・検出力とサンプルサイズが関係していることがわかると思います。　この黄色の部分の式は、以前より進化した部分ですね。　皆さんも、知識や技能は都度バージョンアップしていきましょう。深まってくると楽しくなってきますよ。