トピックス 統計

本当にランダム?

投稿日:

Excelなどで乱数を発生させることがあると思います。 世の中にも乱数を用いて処理する計算があります。 乱数のように見せかけて、データを操作する事例もあるようです。乱数の検証方法は種々考案されていますが、代表的な方法としては「ベンフォードの法則」があります。1~9までの数字の中で、先頭が1である頻度が一番高くなります。

ベンフォードの法則 → ウィキペディア

以下の場合に、ベンフォードの法則は成り立つようです。

  1. 指数関数的に増加する数字の集まり
  2. ある範囲の中で順々に採番された数字の集まり
  3. ある範囲の中で一様に分布することが期待される数字の集まり
  4. いくつかの分布から無作為に選ばれた数字の集まり

上記以外にも「ダイハード・パッケージ」という検証法が提案されています。100×100の駐車スペースに数字を当てはめていく「駐車場テスト」などがあります。 → https://wikijp.org/wiki/Diehard_tests

ビッグデータを分析する際に、故意にデータが改ざんされていないかどうかを検証するツールは必需品です。機械的に作成した乱数は意外と規則性が出ることが多いようです。原始的な方法ですが、サイコロを幾つか用意して振るのが、デタラメを作るにはよさそうです。

-トピックス, 統計

Copyright© 進化するガラクタ , 2022 All Rights Reserved Powered by STINGER.