トピックス 統計

1つのデータで予測?

投稿日:

ベイズ理論を用いて、製品の1つの特性より母集団の確率分布を推測する方法を説明します。

資料はこちら → ベイズ再びその3

p.1 ベイズの公式を少し手直しします。データDに、原因Hθ置き換えます。1/P(D)を定数kとすると、事後確率=k✕尤度✕事前確率という式になりました。右図をご覧ください。データDは、θ、θ、θ、θなどを平均値に持つ分布からきたものです。

p.2 「製造される内容量200mLの清涼飲料水のペットボトルの内容量xは正規分布に従い、分散は1である。3本サンプリングしたところ、201、202及び203mLであった。この工場で製造のペットボトルの内容量xの平均値θの確率分布を求めよ」という問題を、ベイズの公式を用いて算出します。複数の原因の平均値をθとするとき、尤度は各々の確率の掛け算になります。事前確率が不明な場合は、何らかの確率とすることは「情報不足や更新されても求められる」で説明しました。p.1の公式に尤度事前確率を代入して事後確率を算出した結果、平均値=202、分散1/3 の正規分布に従うことがわかります。

p.3 以前「決まったものか、未知なものか?」で同様の問題を解いた説明した際の資料です。このときは、事前確率が不明なので「平均値200、分散4」と仮定して計算しました。その結果、平均値=202.8、分散4/13 の正規分布に従うとなりました。 p.2の結果と微妙に異なります。

p.4 事前確率を1「平均値200、分散4」と仮定した場合の事後確率の分布曲線を描いてみました。どちらが真の分布に違うか不明ですが、「平均値200、分散4」とする根拠がないのであれば、事前確率は1とした方が無難と思われます。

-トピックス, 統計

Copyright© 進化するガラクタ , 2025 All Rights Reserved Powered by STINGER.