トピックス 統計

ここでも平方和が活躍

投稿日:

大型台風の影響いかがですか? 少し和らいだような気がします。

一昨日「平方和」が出て来ました。以前のブログ「実験の効果を判定するには」で「分散分析」を説明しました。今回は、補足説明で、次の資料のp.4がその部分です。他は復習のつもりで見てください。何度も目にすることで、次第に身についていきます。今回は一元配置分散分析です。

説明資料 → 分散分析その2

Excel資料 → 分散分析3

p.2 分散分析の意味は、この左下の図をイメージできればしめたものです。あとは、効果のばらつき(分散)偶然のばらつき(分散)で割った「F値」が大きければ「効果あり」ということになります。

p.3 パラメータがA1~A4、各々3回測定して結果をもとに、効果があるかどうかを評価します。 左側はExcelに自分で作成したものです。「分析ツール」やMinitabを用いれば、左上のデータを基に直ぐ結果を出してくれますが、是非、皆さんは分散分析の原理を理解するために、分析ツールやMinitabで間違った使い方をしていないかを検証してみてください。右上にグラフを載せておきます。 数値の意味とグラフを関連付けてみてください。

p.4 左上は手作業で作成した分散分析表です。その下にF分布表の一部を載せておきます。因子(分子)の自由度誤差(分母)の自由度の部分のF境界値を読み取ります。約4.1です。手作業の場合は、F分布表を見なければならないのが難点です。F分布表以外の分布表を添付しておきます。

各種分布表 → 分布表

分布グラフ → 分布グラフ

Excelの分析ツールやMinitabを実行すると右上のような表がでてきます。「グループ間」はA1~A4の間のこと「グループ内」とはA1~A4各々内輪のことです。ここではA1~A4の効果が前者、誤差が後者です。F値が5.6と計算されています。その横にある「P-値0.023」と「F境界値4.1」の意味を説明します。左下のF分布のグラフF境界値F値の位置関係を示し、その拡大図を右に示しました。このF境界値は、分布の上側5%の存在確率の統計量(横軸)の数値を示します。5%の面積は黄色と緑の面積を合計した部分です。F値5.6境界値の4.1より大きいので、この5%の領域に含まれることを意味しています。これは、「効果が偶然である」という帰無仮説が正しい確率は5%以下であることを示します。 有意差検定でいう「有意差あり」=効果あり を意味します。p値0.023は緑の部分の面積で0.05(5%)より小さい、つまり帰無仮説はあり得ないことを示しています。 最近はp値で議論することが多いです。

p.5 左図はA1~A4個々の効果と誤差の比率を、右図は全体の効果と誤差の比率を示しています。

今回はp.4を詳しく説明しました。今までも資料には載っていたのですが、有意差検定も同じ考え方ですので、何度も説明しておきます。

-トピックス, 統計

Copyright© 進化するガラクタ , 2019 All Rights Reserved Powered by STINGER.