過去のサンプルサイズ算出式の説明資料を見直していたところ、nと(n-1)を用いている資料が混在していました。私が所有している本と先日図書館から借りてきた本も異なるのです。どちらが正しいのかを調べてみると、標準偏差の記号の使い方が多種多様あるのです。専門家でも、人によって異なるので、統一して欲しいものです。以下にまとめてみました。
資料はこちら → 標本の標準偏差
p.1 母集団の分散と標準偏差はσで統一されていますが、標本の分散と標準偏差は多種多様です。同じSでも大文字、小文字があり、不偏分散と標本分散が入れ替わっていたりします。不偏分散は文字を変えているケースも多いですが、まちまちです。σハットは母集団の分散を推定するという意味なのでしょう。大文字と小文字も判別し難いので、標本分散にsを使ったら、不偏分散はuを使うよう決めて欲しいです。
p.2 サンプルサイズ算出には標準誤差SEを用います。SE=不偏分散/√nと覚えておけば間違いはないです。パターンAの場合、sを不偏分散の平方根で標本(不偏)標準偏差とします。Excel関数では「STDEV.S」を用い、(n-1)を用いています。不偏分散という表現はありますが、不偏標準偏差という表現はみたことがないので、区別のためにカッコで記載しておきます。この場合のSE=s/√nとなります。 Bパターンは、sを標本の標準偏差とします。Excel関数では「STDEV.P」を用い、nを用いています。式を変形していくとSE=s/√(n-1)となります。sの定義次第で、√nで割るか√(n-1)で割るかが変わるのです。
p.3 過去に説明したサンプルサイズ算出式も混在していました。Aパターンの場合は「不偏」という語句を追加します。
p.4及び5 標本から母集団を推定することが多いので、標本の標準偏差sは不偏分散で計算してAパターンを用いることにした方が間違いが少ないと考えます。
因みに過去の「歪んだ形状を変換して」「英語の表記の方が分かり易い」「信頼度を上げようとすると焦点がぼやける?」ではSE=s/√(n-1)を用いていました。この際のsは標本標準偏差です。
標本から母集団を推定することが多いので、不偏分散の平方根を標本の標準偏差として記号を統一して欲しいものです。