「統計学の図鑑」(著者:涌井良幸・貞美 発行所:技術評論社)はビジュアルで理解しやすい本です。統計学を復習しながら読んでいます。ベイズ統計学については、10回以上取り上げてきました。上記図鑑を参考にして、基礎的な考え方をまとめました。
資料はこちら → ベイズ再び
p.1 上述の本では、サイコロで説明しています。分かり易いのでアレンジしてまとめます。確率の公式は、起こり得る全ての場合の数で、対象事象の起こる数を割ったものですね。この公式を用いて、A:4以下の目が出る事象の確率が4/6、B:偶数の目が出る事象の確率が3/6となります。4以下で偶数の目がでる「同時確率」は、2/6ですね。このように絵に描いて、四角で囲ってみると理解しやすいですね。
p.2 「条件付き確率」は、ある事象が起きた後に別の事象が起きる確率です。事象Aと事象Bの順番が変わると確率は異なります。次は、ベイズ定理のベースになる「乗法定理」です。P(A∩B)は、上述の「同時確率」ですね。「条件付き確率」は2種類ありますが、この「条件付き確率」にある確率を掛けると「同時確率」になります。P(B│A):Aが起こったときにBが起こる確率の場合はP(A) を、P(A│B):Bが起こったときにAが起こる確率の場合はP(B) を掛けると「同時確率」となります。
p.3 乗法定理をベン図で描くと右上になります。ベイズの定理は乗法定理の3つのうち、右2つの式から得られます。このままでも良いですが、「原因」や「仮定」を示すAをH、「結果」や「データ」を示すBをDと書き直します。 ベイズの定理は原因と結果で示すことが多いので、このように書き換えた方が使用勝手がよくなります。右下が、原因と結果の関係式で、左下がその関係図になります。「尤度(ゆうど)」という耳慣れない語句があります。「結果の確率」を意味していて、原因Hのもとで結果Dが起きる確率を意味しています。
p.4 原因が複数ある場合の、ベイズの定理式です。原因の数が増えると、分母がそれに応じて増えていきます。ベイズの解き方を右下に示します。①先ず左下図のようにモデル化して、尤度(結果確率)を算出します。②原因毎に事前確率を算出します。③定理式より事後確率を算出します。
p.5 具体的な事例で解いてみると理解が深まります。「病気Xを発見する検査T」に関する問題で、「検査で陽性判定があった場合、病気の確率はどのくらいか?」をベイズの定理を用いて算出します。①モデルを設定し、問題文の数値を代入します。②事前確率を文字に当てはめます。③ベイズの定理式に数値を代入して、事後確率を求めます。約38%の確率で病気の可能性があります。確率を低く感じるのは、罹患している人の陽性率98%の数値に騙されてしまう訳です。
今までのベイズ関係のブログは、「AIもベイズ統計利用者?」「レゴでベイズ統計がわかる?」「結果から原因を推測」「情報を表にしてみる」「同じ分布を用いて簡略化」「決まったものか、未知なものか?」「親が子に、子が親に‥‥」「リアルタイムで確率が変わる?」「何回取り上げたかな?」「変えた方が得!!」「結果から原因を推測」「レゴでベイズ統計がわかる?」「アップデートして精度向上」「AIもベイズ統計利用者?」「直観とちがう確率」「標本とすると理解しやすい」16もありました。