トピックス 統計

n-1には悩まされます

投稿日:

不偏分散はなぜnでなくn-1で割るかについては、数学的な説明イメージ的なものいろいろあります。「不偏分散のイメージは?」や「少しずつわかってくる」などでも何回か取り上げてきました。今回は、n数が少ない方からアプローチしてみたいと思います。

資料はこちら → 不偏分散その3

p.1 平均値がμの母集団からという成分2個をサンプリングして標本にします。サンプリングによって、一番上のように(x-xbarが大きい場合もあれば、下二つのように小さい場合もあります。標本の平均値xbarからの差の平方和を変形すると、とxの差が分散の大きさと連動していることがわかります。分散は通常、(平均値xbarからの差の平方和)÷nで表されますが、n=2のときに、(標本の平均値xbarからの差の平方和)で割ると分散が小さく計算されてしまうのが図からのイメージです。そこで、標本の分散は(平均からの偏りの平方和)÷(n-1として「不偏分散」と呼ぶことにします。「-1」で小さくならないように補正するわけです。

p.2 一番上の式、つまり「平均からの偏りの平方和の期待値=(n-1)×σ」が証明できれば、標本の分散=(平均からの偏りの平方和)÷(n-1)が言えます。n=2の場合、式を変形していくと、最終的に一番下の式が誘導されます。途中の黄色の網掛の誘導結果は重要な関係式です。

p.3 n=3の場合も同様に変形していくと、最終的に一番下の式が誘導されます。 以上の事より、分散=σ2=(平均からの偏りの平方和)÷(n-1)であることが証明されました。

今回また、スッキリしないアプローチでした。「nとn-1でどのくらい差が生じるの?」で検討したようにn数増やせば「-1」の影響が少なくなりますので、あまり気にしないようしようかなと思います。

 

-トピックス, 統計

Copyright© 進化するガラクタ , 2021 All Rights Reserved Powered by STINGER.