「独学で鍛える数理思考」(著者:古嶋十潤 発行所:技術評論社)を読み始めました。副題が「先端AI技術と支える数学の基礎」とあります。結構ページボリュームがある本ですので、読み甲斐があります。本日は、「情報検索に関する数理」について、資料にしました。
資料はこちら → 情報検索その1
p.1 左図をご覧ください。インターネットで検索する場合、検索後に表示されるものとされない情報があり、表示される情報及び非表示情報の中には、検索に適合したものと適合しない情報が各々存在します。それらをA〜D とします。右表をご覧ください。再現率Rが赤枠のAとC、適合率Pが青枠のAとBで算出されます。
p.2 数学上は、p.1の計算通りになりますが、インターネットでの再現率及び適合率は、計算通りにならないことがあります。左下のように、非表示の情報の1つを適合に入れると再現率Rは増加します。ところが、D からBに誤って移動させてしまうことも同時に起きてしまいます。すると適合率Pが減少することになります。情報検索の世界では、再現率Rを上げようとして適合率が落ちる現象が起きるようです。
上述の本の内容です。興味がある方は、読んでみてください。
第1章 情報検索を実現する数理
第2章 商品推薦を実現する数理
第3章 画像分類を実現する数理
第4章 文章生成を実現する数理
第5章 音声解析を実現する数理
第6章 衛星測位を実現する数理
巻末付録1 相対性理論の数理的補足
巻末付録2 フーリエ変換の導出