トピックス 統計

少ないデータを有効活用

投稿日:

小標本の場合、N数が少ないので母集団を推定する精度が悪いです。そんな場合に「ブートストラップ法」を用います。

資料をご覧ください。→ ブートストラップ法

母集団からサンプリングした元の標本から何回か再サンプリングして再標本とします。1~5のデータが元の標本データとすると、平均値=3、標本の標準偏差は1.41になります。 この元標本から5回抜取ります。1個抜き取ったら戻します。この5つのデータが、(3,4,2,4,3)だったとすると平均値=2.8です。あと5回同様に抜取り平均値を算出します。この6つの平均値の平均は2.77、平均値の標準偏差は0.48になります。元標本に比較して標準偏差が小さくなりました。平均値と標準偏差を用いて母集団の平均値を推定してみます。95%の信頼区間とすると、元標本を用いた推定値は1.04~4.96、再標本では2.10~3.44に信頼区間が狭まります。精度が向上していますね。 このブートストラップ法は、元標本があれば、シミュレーションで回数多くサンプリングして計算が可能です。 この方法については、明日説明します。 少ないデータでも有効活用しましょうね。

-トピックス, 統計

Copyright© 進化するガラクタ , 2020 All Rights Reserved Powered by STINGER.