今日は「MT(マハラノビス・タグチ)システム」の話です。昨日に続き専門的な話ですみません。インドのマハラノビス博士と我国が誇る「品質工学」の創始者である田口玄一博士の理論に基づく「パターン認識」「予測」「原因分析」に威力を発揮する「多変量解析」の一つです。 簡単に言うと、似た者同士あるいは異常なものの判定をする方法です。2つの書籍「入門MTシステム」(著者:手島昌一 長谷川良子 発行所:日科技連)と「試して究める!品質工学MTシステム解析法入門」(著者:鈴木真人 発行所:日刊工業新聞社)を読んで、資料にまとめてみました。 病気の診断、不良対策、ビッグデータ解析、画像処理に有用な技術です。
資料はこちら → MTシステム その1
p.2 2枚のモナリザの絵が同じのかどうかをどう判定するか?
p.3 田口玄一博士は、「アンナ・カレーニア」の小説の一節を読んで思いついたそうです。幸福な家族に対して不幸な家族はいろいろなレベルがあるのではないか。そのレベルをものさしで測れないか? ということを考えたそうです。
p.4 数字の「5」があった場合、字が上手い人・下手な人、鮮明な印刷・不鮮明な印刷などでいろいろなパターンがあります。その悪さ加減を点数化しようということです。5に見えるものが零点で、5に見えなくなると点数が大きくなっていきます。5×7のマス目を書いて、黒い石の数と方向が変わる数をカウントして、右上の点数表を作成して評価します。
p.5 数学と理科の試験をしていずれの点数の平均値も50点とした時、Aさんは数学65理科65、Bさんは数学50理科71でした。どちらが平均から離れているでしょうか?
p.6 平均(50、50)からA(65,65)とB(50,71)までの距離は、ピタゴラスの定理でAさんが20.1、 Bさんが21.0となり、ほぼ同等です。見た目はBさんの方が平均的なものから乖離しているように見えませんか?
p.7 楕円の形で分布していますね。平均的なものがこの楕円の長軸方向にあるように見えます。
p.8 平均的な集団からの距離をマハラノビスの距離Dとすると2次元の場合、左上の式で表せます。楕円の式に似ていますね。相関係数r=0.9、D=1の時に、u1を変化させてu2を計算してプロットした図が右上図の内側に楕円です。D=2及びD=3と変化させると、外側に楕円が大きくなります。一方、D=2に固定して相関係数rを0.5、0と小さく変化させると円に近づいていきます。 以上のことより、相関係数とマハラノビスの距離がわかれば平均的な集団からのズレを距離として表すことができることがわかります。
p.9~15 相関係数に関する説明です。昨日と重複しますので、説明は省略します。
p.15とp.16を見比べてください。 p.15は全ての点のyの平均36.2%からのズレを残差としています。説明変数がないとは、横軸と縦軸の相関関係はないということを言っています。p.16は、左上がりの相関(青線)があり、その青線からのズレを残差としています。 説明変数がない時の残差の2乗、説明変数がある時の残差の2乗を算出してその差を説明変数がない場合の残差の2乗で除した値を決定係数r2とします。これは相関係数の2乗になります。相関係数はxとyが関係しているかどうかの指標で、決定係数はxからyを求める回帰式の確からしさの指標となります。
p.19 数学と理科の試験結果についてマハラノビスの距離Dを算出した結果、BさんのDが一番大きく、平均的な集団からのズレが大きそうだという定性的な評価を数値として評価することができました。
p.20 マハラノビスの距離Dがどれだけズレていれば、平均的な集団とは違うと言えるのでしょうか? DはΧ2乗(カイ2乗)分布に従いますので、5%の確率で間違えてもよいとした時は、表より閾値を設定します。
p.21 数学と理科の2項目なので自由度2の閾値をみると5.99となります。よって成績表の右欄に記載のマハラノビスの距離Dが5.99より大きい人が3名いますが、この3名は平均的な集団から突出しているとみることができます。
p.22 マハラノビスの距離Dは項目数が増えると情報量が増大するので、コンピュータが必要になります。
p.23 3項目以上に拡張する場合は、行列をコンピュータで計算します。
p.24 マハラノビスの距離Dは項目数kで除して計算します。
p.25、26 新品16個のモーターの12項目の特性値のデータです。このデータを単位空間の行列として、その相関行列に変換します。対角線を1にします。
p.27 新品のモーターを2時間稼働後、8通りの過酷状態で稼働させてデータをとったものです。このデータを用いてマハラノビスの距離Dを算出します。閾値は項目数12で割ります。どのモーターも新品の集団からはズレており、特にマハラノビスの距離Dが大きい実験3及び4は、新品モーターの範囲外になっている項目が存在しています。
p.28 計算上MTシステムが使えない場合を示しています。
p.29 MTシステムを改良したMTA法やT法があります。 不良の原因究明をするにはT法が有用とされています。