不偏分散はなぜnでなくn-1で割るかについては、数学的な説明やイメージ的なものいろいろあります。「不偏分散のイメージは?」や「少しずつわかってくる」などでも何回か取り上げてきました。今回は、n数が少ない方からアプローチしてみたいと思います。
資料はこちら → 不偏分散その3
p.1 平均値がμの母集団からx1とx2という成分2個をサンプリングして標本にします。サンプリングによって、一番上のように(x1-xbar)2が大きい場合もあれば、下二つのように小さい場合もあります。標本の平均値xbarからの差の平方和を変形すると、x1とx2の差が分散の大きさと連動していることがわかります。分散は通常、(平均値xbarからの差の平方和)÷nで表されますが、n=2のときに、(標本の平均値xbarからの差の平方和)を2で割ると分散が小さく計算されてしまうのが図からのイメージです。そこで、標本の分散は(平均からの偏りの平方和)÷(n-1)として「不偏分散」と呼ぶことにします。「-1」で小さくならないように補正するわけです。
p.2 一番上の式、つまり「平均からの偏りの平方和の期待値=(n-1)×σ2」が証明できれば、標本の分散=(平均からの偏りの平方和)÷(n-1)が言えます。n=2の場合、式を変形していくと、最終的に一番下の式が誘導されます。途中の黄色の網掛の誘導結果は重要な関係式です。
p.3 n=3の場合も同様に変形していくと、最終的に一番下の式が誘導されます。 以上の事より、分散=σ2=(平均からの偏りの平方和)÷(n-1)であることが証明されました。
今回また、スッキリしないアプローチでした。「nとn-1でどのくらい差が生じるの?」で検討したようにn数増やせば「-1」の影響が少なくなりますので、あまり気にしないようしようかなと思います。