図書館新刊本の「文系の私に超わかりやすく統計学を教えてください」(著者:高橋 信 発行所:かんき出版)を紹介します。1日で読めました。統計が全くわからない文系の登場人物との対話方式により基礎的な事項が説明されていますので、初歩の方には読み易いのではないかと思います。私も、新しい知見を得ることができましたので、紹介します。
資料はこちら → カテゴリカルデータ
Yes・Noのアンケート結果も統計処理が可能です。いいえを0、はいを1として「2値化」します。 この2値化のデータの平均値xbar(バー)、平方和、分散及び標準偏差を求めます。分散と標準偏差を見るとxbar(1-xbar)という式で表されます。2値化の場合は、必ずこの式になるようです。Yes・Noあるいは有り無しデータの統計処理には使えそうです。 例えば、米国の大統領選でトランプを支持する場合を1、しないを0として、1万人をランダム調査をして母集団の割合を推定する場合にも使えます。標本の平均値が0.4とすると分散は0.4×(1-0.4)=0.24、標準偏差σ=√0.24=0.49となります。母集団のトランプ支持率μは、0.4+1.96×0.49/(√10,000)≧μ≧0.4-1.96×0.49/(√10,000)つまり0.41≧μ≧0.39と推定できます。1.96はK値と呼び、95%の信頼度を推定するための閾値です。正規分布表から求めます。
どんなに平易に書かれた本であっても得るものは必ずあります。 本の裏表紙に「文系人間はも安心して読んでください」と書かれています。「は」に二重線をして「も」に訂正されています。文系以外の人も読んでねという意味だろうと思います。皆さんも、一度目に通してみてください。