トピックス 統計

少しずつわかってくる

投稿日:

統計に登場する「不偏分散」について「不偏分散のイメージは?」と「nとn-1でどのくらい差が生じるの?」で説明してきましたが、「なぜnでなくn-1で割るのか?」を分かり易く説明して欲しいと知人に頼まれて悩んでいます。とりあえず、以下のように説明資料を作成してみました。私が統計を勉強し始めた頃から、未だにまだ理解しやすく説明ができていない問題です。

資料はこちら → 不偏分散

p.1 以前の資料にxiを書き入れてみました。母集団内にxiというデータがあります。母集団の平均値μ、ある標本の平均値barとします。 分散(xi-μ)あるいは(xi-xbar平方和で割った値です。(xi-μ)>(xi-xbarなので、標本分散の方を過小評価することになります。そこでnではなn-1で補正するというのが1つの説明です。

p.2 母集団から幾つかサンプリングした標本の平均値の分布の平均値(標本平均)と分散を期待値として算出しています。標本平均の期待値は母集団の平均値μになります。標本平均の分布の分散の期待値σ/nです。

p.3 標本の分散sから母集団の分散σを推定する必要があります。そのために、標本分散の式を変形して、母集団の平均値μを入れます。これにより「標本分散の平均=母分散標本平均の分散=σ-σ/n」という関係式が得られます。標本数nを増やせば(標本の分散の平均)=母分散になりますね。nが大きくない場合、n/(n-1)を標本分散にかけて補正して母分散σを推定できるのです。

p.4 n/(n-1)はnが増すと分散は1に収束していきます。

p.5 n個サンプリングした標本の標準偏差はn個の平均(σ/√n)、分散はこの平方ですのでσ/nです。P.5は、p.2の一番下の式σ/nを図で説明したものです。

今までよりは、多少スッキリ感がでてきました。もう少し分かり易い説明が可能になったら、報告します。

-トピックス, 統計

Copyright© 進化するガラクタ , 2021 All Rights Reserved Powered by STINGER.