ベイズ統計に関しては、今までも何回か取り上げてきましたが、いまいち腑におちていませんでした。今回「数学独習法」(著者:冨島佑允 発行所:講談社)を読んでいたところ、ベイズ統計が最近注目されてきた理由が少しわかったような気がしています。
資料ご覧ください → ベイズ統計4
p.1 事前に、100個のサイコロのうち3個が1/3の確率で1の目が出るイカサマがあるという情報がありました。そこで、あるサイコロを振ったところ、5回連続して1が出るのを確認しました。では、左図をご覧ください。縦軸がある目が出る確率、横軸がいかさまでないサイコロの比率0.97といかさまのサイコロの比率0.03を示しています。四角形の面積が1の目が出る確率を示しています。下の白地は1以外の目が出る確率を示します。 サイコロを連続5回振って1の目が出る確率は、いかさまでないサイコロは(1/6)5、いかさまさいころは(1/3)5となるので面積は右図のようになります。
p.2 さいころが不正である確率は、AとBの面積の和でBの面積を割った値です。この式を変形していき、不正の比率Pで括った式が得られます。P(不正)は事前情報です。カッコの中は振る回数によってデータが更新されます。 したがって不正である確率は、得られる情報によりアップデートしていくのです。 これがベイズ統計が最近利用される理由なのです。事後確率は、新しいデータにより事前確率をアップデートしていくのです。 例えば5回連続のデータを入れると不正になる確率は約50%、事前の確率は3%ですから17倍も不正の確率が増加しています。
p.3 横軸が1の目が連続して出た回数、縦軸が不正の確率です。ある事象が多く観測されることで精度が上がっていくことがわかります。経験を積む(学習する)と確率精度が高くなります。
サイコロのイカサマを見破る方法は、以前「イカサマの確率は?」でも説明しました。