トピックス 統計

統計用ワークシート作成します

投稿日:

統計手法の意味をある程度理解した方には、統計ソフト(MinitabやR)およびExcelの分析ツールは非常に便利で効率的です。ところが実行結果について考察するためには、手法の意味を理解しておく必要があります。これから説明する統計の学習法は、私が実践してきた方法です。Excelのセルに計算式を入れて手作業で計算する方法です。例えば、Excelで不偏分散を算出する際は、STDEV.S(or STDEV)を用いれば簡単に値が得られます。これを、√∑(xi-xbar)2/nに数値を入れて実際に計算してみるのです。ただし、∑(xi-xbar)2は、(xi-xbar)を計算後に、Excel関数の「SUMSQ()」を利用して、少し楽をします。 次に単回帰分析のワークシートを作成してみました。

単回帰分析のワークシートはこちら → 単回帰ワークシート

原理」のシート: 可能な限り用いる計算式とその意味を載せておきました。興味のある方はお読みください。

単回帰_ワークシート」のシート: ①~⑤の順番黄色のセルに計算式を入れて計算してください。直線の勾配は「SLOPE()」、切片は「INTERCEPT()」で簡単に計算できますが、それはしないでください勾配の分子xとyの「共分散」、分母xの分散であることを見て欲しいのです。分子と分母にあるxの項を消すと、分子がyの偏差分母がxの偏差になるので、イメージとして勾配を表していると考えられませんか? 例えば、分母に比較して分子が大きければ勾配は急に、その反対であれば勾配は緩やかになります。 また、この分散の式にはΣ(xi-xbarが入っていますね。「平方和」と呼ばれるもので、分散分析寸法の交差に度々登場してくるので、重要な式です。 手計算をすることで、統計の中身が少しずつわかってきませんか?

単回帰_実行結果」のシート: ワークシートで計算式がわからなかった方は、ご覧ください。右下のグラフをご覧ください。グラフにおいて、近似式と決定係数(R2)を表示させると、手計算の値と一致していますね。決定係数相関係数の違いは過去ブログ「いい加減に覚えると後が大変」をご覧ください。 グラフに2本の赤線があります。これがxの平均値xbar、とyの平均値ybarを示しています。この交点を原点にして水平の赤線に投影した数値(の範囲)がxの偏差垂直な赤線に投影した数値(オレンジ色の範囲)がyの偏差になります。最大値最小値だけ矢印で示しています。上述に説明したように、勾配とはy方向の偏差をx方向の偏差で割ったイメージです。このグラフの場合は、xおよびy方向は同程度の偏差なので、45°に近い勾配になるわけです。

右の方にあるシートは、統計ソフトで試す際に利用できるデータセットです。

これからもこのようなワークシートを「統計用ワークシート」に追加していきますので、そちらのページをご利用ください。説明が必要な場合は、随時説明していきます。繰り返しになりますが、手を動かして作業することは理解を助けます。是非、時間を惜しまず手を動かしてみてください。

 

 

 

 

 

 

-トピックス, 統計

Copyright© 進化するガラクタ , 2020 All Rights Reserved Powered by STINGER.