トピックス 品質工学 統計

違いは距離で区別する

更新日:

統計に用いるワークシート第6弾で、MT法を取り上げます。MT法(マハラノビス・タグチ)については、過去ブログ「やっと理解の糸が繋がった」「正常、異常をどう数値で判断するか?」「MTシステムの活用例」で既に説明しています。今回は手作業を念頭にExcelのワークシートをリニューアルしました。

ワークシートのExcelファイルはこちら → MT法ワークシート

このワークシートの構成は第5弾までと同様です。 原理、ワークシートおよび実行結果のシートがあります。ワークシートの黄色のセルに式を入れて計算するだけです。

MT法とは、主成分分析と同じデータを用いて、どのデータが主成分のデータに近いか、遠いデータはどれか定量的に距離で判定するシステムを指します。 正常値か異常値か? 健康人か? 疾病者か?を判定する場合に利用されます。

今回は、手作業のためxとyの2つのパラメータのワークシートです。今回は難しくありません。xとyの標準化した数値を求め、マハラノビス距離Dの式に入れて算出するだけです。D値が小さいほど主成分群に近いことを示します。

Dの式に相関係数rが入っていることに着目してください。相関係数が0の場合は、距離Dは円の半径になります。1/(1-rは、このところ何回か登場してきた分散・共分散行列の逆行列なのです。式の誘導に興味がある方は、過去ブログ「やっと理解の糸が繋がった」をご覧ください。

この距離の概念は、機械学習における画像認識での応用が多いですね。興味がある方は「教師なし学習で失敗することもあり」「手つなぎ鬼のように仲間を増やしていく」「どのアルゴリズムがクラスタリング性能がいい?」をご覧ください。

-トピックス, 品質工学, 統計

Copyright© 進化するガラクタ , 2020 All Rights Reserved Powered by STINGER.