統計の確率密度関数は複雑な数式になっています。正規分布は比較的イメージし易い式なのですが、t分布の式は複雑な式です。しかも見慣れない「Γ」という記号が入っています。「ガンマ関数」の記号です。どんな性質があるのか、調べてみました。 資料をご覧ください。
資料はこちら → ガンマ関数
p.1 正規分布の確率密度関数は母集団の平均値μと標準偏差σが入った分かり易い式ですね。 ところがt分布の式をご覧ください。母集団の平均値やσは含まれず自由度νと統計量tが入っています。このガンマ関数とは何者でしょうか?
p.2 定義とその式を書いておきます。nが任意の正の整数の場合、Γ(n+1)=n!という面白い関係があります。
p.3 階乗(!)というと正の整数なので、連続ではなく離散的な数値になります。グラフに描くと、飛び飛びのプロットになりますね。ガンマ関数の変数は連続なので、プロットすると連続な曲線になります。先日のバスタブ曲線に似ていますね。確かに階乗の数値はこの曲線の上に載っています。階乗のExcelでの関数は「=FACT(n)」、ガンマ関数は「=GAMMA(n)」あるいは「=EXP(GAMMALN(n))」。FACTは小数の場合は計算不能です。
p.4 Γ(n)=(n-1)! =(n-1)Γ(n-1)という関係式があります。n=3.5の時Γ(3.5)はいくつになるでしょうか? 2.5!という階乗は整数でないので存在しないはずのですが、ガンマ関数であれば計算可能です。階乗の場合、2.5!=2.5*1.5*0.5!と1ずつ減じていき0.5!で止まってしまいます。Γ(0.5)は左のように定義式に入れて計算していくと「√π」になるのです。よってΓ(3.5)≒3.323と算出されます。
まだ、なぜt分布にガンマ関数が使われているかわからないのですが、次のように導出しているWebsiteがありました。見ても複雑で理解不能でした。理解できたらまた報告しますが、次の理由ではないかと考えています。 ポアソン分布も二項分布も離散的な分布でn数が増えると連続的な正規分布になっていますね。離散と連続の橋渡しをしているのが、このガンマ関数なのではないでしょうか? 離散分布には必ず組合せによる確率計算に階乗が出て来ますから、離散的な分布を連続な分布に拡張する役目ではないかと現時点では思っています。
t分布の関数導出はこちら → http://www.f-denshi.com/000TokiwaJPN/17kakto/120prob.html