トピックス 品質 統計

同じ土俵に載せる

投稿日:

統計の本を最初から読むと直ぐに眠くなってしまい、途中で断念することを繰り返してきました。 最近は、一つの本を隅々まで読むことはやめて、いろいろな本を流し読み回しして、理解しやすい部分だけピックアップするようにしました。 理解し難いところは、それ以上突っ込まずにそのままにしておくと、そのうちに「そうなんだ」という説明に当たることがよく起きます。

先ずは「統計量」の話をします。「統計量」を理解すると、「統計的検定」の理屈がわかってきます。 以前の説明資料でも説明していますが、復習として見てください。

資料はこちら →  統計量

分布は「平均値」と「ばらつき(分散あるいは標準偏差)」の2つの要素で表すことが可能です。 

p.2 体重測定の結果が、平均体重が60kg標準偏差10kg正規分布であったとします。平均60kgにピーク、左右の変曲点50kg70kgにある釣鐘状の分布として描けます。

p.3 統計量を説明します。

 統計量=(数値-平均値)÷標準偏差 の基本式は重要です。分布の形態により、多少変形はありますが、覚えてください

統計量を算出する操作のことを「基準化」とか「標準化」と呼びます。

いろいろな体重について、統計量を算出してみます。

  体重60kgの場合、上式の数値60kgを代入すると、統計量=(60kg-60kg)÷10kg=0

    同様に、70kgの場合: 統計量=(70kg-60kg)÷10kg1

    同様に、80kgの場合: 統計量=(80kg-60kg)÷10kg=2

    同様に、90kgの場合: 統計量=(90kg-60kg)÷10kg=3 

    同様に、30kgの場合: 統計量=(30kg-60kg)÷10kg=3

上の計算式にkgという単位が入っているのに気が付きましたか? (学校教育でも、単位を入れて計算する習慣を教えてくれると有難いのですが) 算出結果には単位がありません。 無次元なのです。平均値50kg標準偏差10kgの分布を、平均値0標準偏差1の分布に置き換えたことになります。この分布が「標準正規分布」と呼ばれているもので、統計量の数値をみれば何%の人が存在するかの確率がわかるのです。 

p.4 統計量1、2及びの下に片側0.3410.477及び0.498と記載してあります。釣鐘の面積を1(100%)とした時、統計量0~1(黄色)の部分の面積が0.341、0~2の面積が0.477そして0~3までの面積が0.498を示しています。下の3つの図は、黄色の部分の面積を2倍して%表示にした数値(確率)を記載しています。 平均値±σ(標準偏差)には68%平均値±2σには95.4平均値±3σには99.7%存在します。 σの前についている数字が上述で計算した統計量の1、2及び3なのです。 平均値60kgσ=10kgを代入すると、平均値±3σ60kg±3×10kg=60kg±30kgとなり、 つまり体重30kg~90kgの人数は、全体の99.7%いることになります。 どんな平均値、標準偏差の分布のものでも、平均値0標準偏差1置き換え、統計量を算出することにより、対象の数値が分布のどの辺りに位置するかわかります。 このように比較し易くする操作を「基準化」「標準化」と呼ぶのです。

偏差値」は、例えば、国語や算数のテスト結果を同じ土俵に乗せる手段です。 偏差値{(数値-平均値)÷標準偏差}×1050統計量×1050つまり、平均値を50にして、σを10点にした分布に合わせた数値なのです。 科目により平均値や標準偏差が異なっても、同じ土俵(偏差値)評価しようというものです。 99.7%に入る偏差値は、統計量が±3ですから、±3×105020または80、つまり偏差値20以下と80以上の人は、10099.70.3%しか存在しないのです。

p.5 標準正規分布表の見方を説明します。 統計量z左端の列上段になります。上段は小数点以下の値です。統計量1.00、2.00及び3.00ピンクの枠の数値を読み取ります。この数値は片側の確率ですので、両側では2倍にします。これが上述のp.4の値です。 「有意水準0.05(5%)で片側検定する」場合は、確率(面積)=0.5-0.05=0.45(50-5=45%)になりますので、0.45に近い数値を表の中から探します.44950(赤枠が一番近いので、左列と上段よる統計量z=1.64となります。「有意水準0.05で両側検定する」場合は、確率(面積)=0.5-0.025=0.475(50-2.5=47.5%)となるので、.47500(赤枠を探し統計量z=1.96となります。

Excelで確率(面積)を求める関数は、「NORM.S.DIST(z, TRUE)」です。zに統計量を入れてください。 統計量zを求める関数は、「NORM.S.INV(α)」です。αに0.05片側5%)あるいは0.025(両側5%)を入れてください。

いかがでしたか? この統計量の意味がイメージできれば、次に説明する「統計的検定」の半分以上理解できたと思います。

 

-トピックス, 品質, 統計

Copyright© 進化するガラクタ , 2024 All Rights Reserved Powered by STINGER.