Excelなどで乱数を発生させることがあると思います。 世の中にも乱数を用いて処理する計算があります。 乱数のように見せかけて、データを操作する事例もあるようです。乱数の検証方法は種々考案されていますが、代表的な方法としては「ベンフォードの法則」があります。1~9までの数字の中で、先頭が1である頻度が一番高くなります。
ベンフォードの法則 → ウィキペディア
以下の場合に、ベンフォードの法則は成り立つようです。
- 指数関数的に増加する数字の集まり
- ある範囲の中で順々に採番された数字の集まり
- ある範囲の中で一様に分布することが期待される数字の集まり
- いくつかの分布から無作為に選ばれた数字の集まり
上記以外にも「ダイハード・パッケージ」という検証法が提案されています。100×100の駐車スペースに数字を当てはめていく「駐車場テスト」などがあります。 → https://wikijp.org/wiki/Diehard_tests
ビッグデータを分析する際に、故意にデータが改ざんされていないかどうかを検証するツールは必需品です。機械的に作成した乱数は意外と規則性が出ることが多いようです。原始的な方法ですが、サイコロを幾つか用意して振るのが、デタラメを作るにはよさそうです。