「信頼度を上げようとすると焦点がぼやける?」で統計的推定の説明をしました。その後、研修用資料を作成していく中で、マイナーな修正を加えました。資料をご覧ください。背景がグレーのページは修正・加筆前です。追加・修正した部分を説明しますが、どこが変わったか気が付きますか? 変えた部分に伝えたいメッセージが含まれていることが多くありますので、ご注意ください。本ブログの「進化する・・」は、より良いものを目指しています。
資料はこちら → 統計的推定(修正)
p.2 p.3とp.4のページをまとめて一つにしました。エラーバーがSDとSEのように見えてしまうのでp.3の図より消しました。p.4のピンクの矢印範囲がエラーバーと同じと誤解を与えてしまうので、p.2のようにエラーバーの範囲を明確にしました。今回のエラーバーは±3SD(σ)であったり±2SE(σ/√n)としていますが、Max・Minの場合もありますので、グラフ内の表記をよく見てください。 今回伝えたいのは、標準偏差(SD)と標準誤差(SE)の違いです。左の分布が、標準偏差σの母集団の分布です。±3σに99.7%が含まれる正規分布ですね。 この母集団からサンプルサイズnでサンプリングしてきた標本の平均値の分布が右図です。標本平均の分布の標準偏差が(σ/√n)で、これが標準誤差SEなのです。英語のSEは、Standard Error of meanの略です。「mean」のように「平均」と書かれているのです。こちらの方が分かり易い。 標本平均の分布は、平均0を中心にして±3(σ/√n)の拡がりを持った分布です。標本データより母集団の平均値を推定した時に、95%の信頼度では±2(σ/√n)の範囲に母集団の平均値があることを意味しています。したがって、縦軸を成分の含有量とした経時変化のグラフがあった場合、エラーバーがSDなのかSEなのかで、意味が異なってくるのです。ばらつきの推移に着目(左上図)しているのか、平均値の推移に着目(右上図)しているかの違いです。
p.7 p.8のマイナーチェンジです。「平均値μ」を上図に移動して矢印で0に行くように変えました。μを基準化するとゼロ0になるからです。つまらない変更と思われるかもしれませんが、基準化の操作を正確に示さないといけませんからね。
p.12 p.13のイメージ図をアーチェリーをモデルに書き換えてみました。 練習の試射での情報を基に、本番で的の中心を狙って射った場合に矢が入る範囲を信頼区間と呼びます。信頼度95%の場合は、5%はこの領域から外れると予想します。日本の和弓には、目盛のついたサイトが付いていないので、矢の先等を目印にして狙いますが、アーチェリー(洋弓)ではサイトを付ける場合があります。射る度ごとにサイトの目盛を記録しておき、平均値の目盛を決めます。実際に当たった矢の後が図のように的の中心より上にズレている場合は、サイトを上に移動させます。その際に平均値の目盛を参考にします。
p.14 p.15の図に色を塗ってみました。白の部分が正しく推定する範囲で、ピンクが間違える範囲を示しています。グラフの上に、分布のばらつき具合のイメージを描いておきます。
p.16 p.17のマイナーチェンジです。下段の式中の許容誤差Eを緑字にしました。右にある「品質部門と~」のコメント文を訂正しました。
p.20 母分散の推定幅を用いても、p.14のようにサンプルサイズを決める図を描くことができます。不等式を変形していくと、右下のようになります。複雑な式ですが、左辺をご覧ください。分母のs2は標本の分散、分子は母分散σ2です。標本と母分散の比を表しています。
p.21 上述の標本と母分散の比をサンプルサイズnに対してプロットしたものが右図です。分母は標本の分散ですので既知ですね。このグラフからは「サンプルサイズnを増加すると母分散σ2の推定幅がゼロに漸近」することがわかります。このグラフからも、サンプルサイズnが30以上あれば母分散の推定値はほぼ一定とみなすことができそうです。
統計的なサンプルサイズはn=30以上あればよさそうにみえませんか? 本日の変更点について、少しは理解していただけましたでしょうか?
現在、サンプルサイズ設定の考え方をまとめていますので、出来上がり次第、順次披露していこうと思います。