トピックス 品質管理

用いるか、用いないかで変わる

投稿日:

箱ひげ図は、Excelで簡単に描けることは、「視覚的で便利」添付資料のp.2及び3で説明しました。今回は、データの中央値を用いるか用いないかにより同じ数値であっても「外れ値」になったり、ならなかったりする場合がありますので、事例で説明いたします。

資料はこちら → 箱ひげ図その2

p.1 説明し易くするために、左表のように1~51までのデータを考えます。この場合、中央値は「26」です。箱ひげ図内で右クリックすると、右上のポップアップが現れます。下方に「包括的中央値」と「排他的中央値」を選択する箇所があります。「包括的中央値」は中央値を用い、「排他的中央値」は中央値を除外します。これにより、箱の長さに違いが出ます。1四分位点あるいは3四分位点は、中央値より下方のデータあるいは上方データの中央値ですが、ピッタリの中央値がない(データ数が偶数)場合は、2つのデータの平均値とします。

p.2 「包括的中央値」と「排他的中央値」の場合に、1四分位点あるいは3四分位点の値を算出すると右上の通りとなります。箱の長さ上限境界値が異なります。次に、51番目の値を、79、77あるいは75に変えて、「包括的中央値」と「排他的中央値」の箱ひげ図を描いてみます。「包括的中央値」の上限境界値は76.5、「排他的中央値」の上限境界値は78です。上限境界値=3四分位点+(箱の長さ)×1.5で算出します。「79」の場合は、上限境界値より大きいため、外れ値として表示されます。「77」の場合は、「包括的中央値」で外れ値、「排他的中央値」では最大値となります。「75」の場合は、「包括的中央値」と「排他的中央値」いずれも最大値となります。 以上のように、上限境界値に近い値の場合は、「包括的中央値」と「排他的中央値」の何れかを採用するかについて吟味が必要です。

-トピックス, 品質管理

Copyright© 進化するガラクタ , 2024 All Rights Reserved Powered by STINGER.