トピックス 品質工学

こんなところで繋がっていた

投稿日:

マハラノビス距離については、何度も取り上げてきました。「MT法にpythonを使ってみました」「正常、異常をどう数値で判断するか?」「違いは距離で区別する」「やっと理解の糸が繋がった」 先ほど「恋する統計学 回帰分析入門」(著者:金城俊哉 発行所:秀和システム)を読んでいたら、今まで意識していなかったことを改めて認識しました。一変量のマハラノビス距離は、「標準化」と同意だったのです。当たり前のことだったのかもしれませんが、そう言われれば、そうですね。この本は、ある程度統計が解ってきた方であれば、読みやすく良いと思います。具体的に数値を入れて確認しながら進めています。

資料はこちら → マハラノビス距離その2

p.1 以前の説明資料の再掲です。2変量の場合のマハラノビス距離の定義式です。これを見ただけで、敬遠しそうな式ですが、多変量にも拡張できる式です。各変量の分散、共分散のデータがあれば、変量間の距離が算出できるのです。行列なので、コンピュータ解析も容易になります。

p.2 今回は、1変量の場合の式に変形します。そうすると赤枠内の式になってしまいます。この式は、本ブログで何度も登場した「標準化」の式そのものだったのです。標準偏差を物差しにして、距離を測っているのがマハラノビス距離なのです。この式が、複数の変量に拡張されていったのですね。先人たちは素晴らしい。

p.3 1変量の計算例が、上述の本で載っていましたので、絵に描いてみました。グループPとQに左上のような統計データがある場合に、x=7の人はどちらのグループに近いか?という問題です。絵に描いてみると、x=7の人は、グループPの右端で、グループQの左半分に位置しています。有意差検定でも微妙な位置です。マハラノビス距離を計算してみると、グループQに近いことがわかります。

p.4 左上のような2変量の統計データがある場合、x=5、y=7はどちらのグループに近いか?という問題です。図に描いて見ても、緑の点はどちらのグループに近いかなかなか判断し難いです。計算してみると、若干グループQの方が距離が近いことがわかります。

 

-トピックス, 品質工学

Copyright© 進化するガラクタ , 2024 All Rights Reserved Powered by STINGER.