トピックス 統計

形を数値化して判断する

投稿日:

昨日、幾つかの分布を示しましたが、今日は分布の形を定量化する指標「歪度(わいど)」と「尖度(せんど)」について説明します。資料ご覧ください。

説明資料はこちら → 歪度、尖度

Excelファイルはこちら → 歪度、尖度

p.1 先ず「歪度」です。左上の表に3種類のデータ(A、B及びC)があります。詳細データは上記Excelファイルをご覧ください。

縦に体重208人分のデータが小さい順に並んでいます。その上に、平均値標準偏差があります。このデータのヒストグラムは下の3つのグラフです。Aは左寄り、Bは左右対称、Cは右寄りの分布形状をしています。この違いを「歪度」で算出します。

算出式は中央にあります。この括弧の中はどこかで見た覚えはありませんか? 過去ブログ「同じ土俵に載せる」に示した「統計量」なのです。何度も言いますが、この概念大事です。これが理解できれば、統計が分かってきます。歪度は、この統計量の3乗加算して平均値を求めています。 左寄りに偏っている場合は、歪度は正左右対称はゼロ右寄りの場合はの値を示します。 直感的には左寄りが負、右寄りが正になりそうな気がしませんか。そこでExcelで確認してみました。分布の人数が少なくても、その分布の平均値から距離が遠いと3乗で効いてくるのです。左に偏っている場合は、右(体重が重い人)の影響を、右に偏っている場合は左(体重が軽い人)の影響を受ける式になっています。右上のグラフは、縦軸に個人個人の統計量の3乗をプロットしたものです。分布のすそ野が長い方の統計量の3乗の絶対値が大きく、これらが歪度の算出に効いてくるのです。

p.2 「尖度」の算出式は、統計量の4乗の和から3を差し引いた値です。平均体重D、E及びFとも50kgですが、Dは正規分布に近いもの、Eは尖ったもの、そしてFは台地状の分布です。中央の算出式で計算すると、尖度Dが-0.1、Eが1.7そしてFが-0.7となります。正の場合尖り負の場合は扁平なグラフになるようです。正規分布ではゼロになります。

いかがでしたか? 正規分布に近いか否かの判定に利用可能です。

-トピックス, 統計

Copyright© 進化するガラクタ , 2020 All Rights Reserved Powered by STINGER.