先日の「基礎に戻る?」や「SN比のイメージ」において、SN比の式でVeを引く理由は後日説明すると言って、後回しにしてきました。先日、図書館から借りて来た「統計基礎からはじめる品質工学入門」(著者:小野元久 発行所:日本規格協会)では、田口先生が提唱したVeを引く式に代わり変動型SN比で説明されています。この変動比型SN比は「エネルギー比型SN比」とも呼ばれているそうです。初心者には、こちらの方が理解し易いのではないかと著者は述べています。理解が追いつきましたら、また後日紹介します。 確かに、Veをなぜ引くか?という疑問を何年も品質工学を実施してきた私でも上手く説明できずに、もやもやしていたのですから、上述の著者の言われることも尤もだと思います。 今回、完璧ではありませんが、「Veを引く理由」について説明したいと思います。
資料をご覧ください。 → 期待値
p.1 式を導出するに当たり、期待値という概念が必要です。値が飛び飛び(離散的)のデータの場合、そのデータの数値xiとそれが起き得る確率をpiとおくと、1回に起き得る平均的なデータが「期待値」と呼びます。(データ数値)×(確率)を合算したものになります。サイコロの1~6の目は各々1/6の確率で出ますので、目の数と1/6を掛けて足し合わせると3.5になります。1回に出る目は平均3.5となります。目の数に合わせて100から600円の賞金が貰えるとする場合は、賞金額×1/6の合計を計算して350円が期待値となります。こちらの方が分かり易いですね。何回も繰り返すと350円をピークにした釣鐘状の分布になりますね。N数を増やしていくと、期待値はこの分布の平均値(分布のピーク)に近づいていきます。
p.2 この分布のばらつき(分散)は、データxiから平均値(=期待値)を引いたものを2乗して、確率を掛けて合算したものです。サイコロの場合について計算してみました。
p.3 先ずは一番下の赤字の式を導きます。この式重要です。上述では離散的な数値の場合の式でしたが、連続変数に拡張します。右の分布の確率変数に適用します。平均値がμで、期待値E[X]でもあります。離散の場合のΣから積分に置き換えます。f(x)は分布のxにおける確率ですね。それほど難しくないですね。途中でμをE[X]に置き換えるだけです。
p.4 データXの2乗の期待値は、X2とはならずに分散の項が付加され、Xの期待値のようにμ一つにならないのです。この後、式を変形していますが、Veを差し引かなければならないのは、この分散が付加されているためなのです。 一昨日、線形式Lが出てきたの覚えていますか。ここではL=c1X1+c2X2+・・+ckXkを考えます。期待値E[L],分散V[L]及び期待値「X2]は、このように表せます。 勾配βは線形式をrで割った値です。期待値[β2]は上述のLと見比べて、β2+(σ2/r)となります。 Sβは一昨日出てきたようにβ2・rなので、期待値[Sβ]はrβ2+σ2となります。σ2は誤差分散Veに置き換えて変形するとSN比の式の分母のβ2が求まります。VeがSβから引かれていますね。 日本規格協会の本を参考にしましたが、ようやくたどり着けました。キーポイントはE[X2]={E[X]}2+V[X]の式ですね。 加えて、本では詳細な変形が書かれていないのですが、赤枠の部分は付け足しました。 どうしてσ2をrで割るのかが腑に落ちませんでしたが、これでスッキリ!! ブログを読んでおられる方に、このスッキリ感は伝わらないと思います。 難解な内容は、いつかは理解できるという思いで、今後も勉強していきます。皆さんもね!!