統計に用いる分布について整理してみます。資料ご覧ください。
資料はこちら → 分布の形
p.1「離散量」と「連続量」の2つに大きく分類分けされます。離散とは、デジタル的な変化です。整数がそうですね。サイコロの目1から6を横軸にして、出た目の数を棒グラフにしたものが離散的な分布です。 一様分布は度数が等しい分布です。イカサマなサイコロでなければ、各々の出る目の確率は1/6で一様ですね。連続な一様分布は、適切な例が出てきませんが、宝くじのダーツで当たった場所の角度でしょうか?角度は連続的なので。 2項分布は、ある確率で出現する事象を複数回実施した時に出現する度数を離散的に描いたものです。 コインであれば裏表の確率が1/2なので、10回試行すると5回目にピークをもった分布になります。この試行回数を増大していくとグラフの右にずれていき、形が正規分布に近づいていきます。この分布の面積を1とすると確率分布と呼ばれる正規分布になります。発生する頻度が少ない場合は、ポアソン分布ですが、これもN数が増加すると正規分布に近づきます。 連続量の分布で、t分布は、n数が小さい場合あるいは、分布の分散が不明な場合に用います。これも、n数増加に伴い正規分布に漸近します。 χ2分布は、ある正規分布からサンプリングしたものを2乗した分布です。複数の場合は、2乗の和(平方和)です。 平方和というと「分散」を思い出してください。 この分布は分散を評価する際に用います。 このχ2分布の比を計算したものがF分布です。したがって、この分布は2つの集団の分散の程度を検定することができます。
p.2 正規分布をExcelで描く方法です。セルに=NORM.DIST(x,平均,標準偏差,FALSE)の計算式を入れてください。t分布は、=T.DIST(x,自由度,FALSE)です。ここで自由度に大きな数値を入れていくと正規分布に漸近していくことがグラフで明らかです。
P.3 χ2分布は=CHISQ.DIST (x,自由度,FALSE)、F分布は=F.DIST(x,自由度1,自由度2,FALSE)で描くことができます。
2項分布、ポアソン分布及びt分布はn数が増加すると正規分布に漸近していきます。「全ての道はローマに通じる」のようですね。正規分布の式には、ネイピア数eがありますが、自然の摂理なのでしょうか?
皆さんも、自由度を変えてどのようなグラフが描けられるか試してみると理解が深まります。
Excelファイルはこちら → 分布グラフ