サンプリングした標本の相関係数rを求めて、本当に相関があると言えるのかを検定する方法を説明します。
資料をご覧ください → 相関係数の検定その2
p.1 昨日の資料の再掲です。標本の相関係数は非対称分布なので、z変換で正規化するのでした。
p.2 z変換した際に母相関係数ρがゼロの場合、標準偏差s=1/√(n-3)の正規分布になることが知られています。標本サイズが12(左図)と103(右図)の場合の分布です。サンプルサイズが大きいほど標準偏差が小さい分布になります。
p.3 母相関係数ρ:0、 標本相関係数r: 0.8、 n数:12 の場合、自由度n-2のt分布に従います。この時の不偏標準誤差は緑枠内の式で表され、今回は0.19と計算されます。統計量Tは右上の式で書かれ、母相関係数ρ=0の時の式が算出されます。 いよいよ、有意差検定です。 帰無仮説は母相関係数ρはゼロである、対立仮説は母相関係数ρはゼロでないとします。 サンプリングした標本の相関係数r=0.8の時、統計量T=4.24と計算されます。棄却域となる閾値は両側検定の有意差5%、自由度n-2のt分布表あるいはExcel関数のTDIST(0.05,10)=2.23と算出されます。統計量>閾値となるので、帰無仮説は棄却され対立仮説が採用、つまり相関があると検定されました。
標本の相関係数rが小さくなると、統計量Tも小さくなり閾値より小さくなると相関なしと判定されます。 久々に統計の説明でした。