昨日、KMeans法で月形状のデータをクラスター分類できませんでした。 そこで、「DBSCAN」というアルゴリズムで分類してみます。
先ずは動画(英語)を見てください。 → https://www.youtube.com/watch?v=5E097ZLE9Sg
資料 → DBSCAN
p.1 ある半径内の入っている数を決めておきます。例えば4個とします。その中に入っているものが「Core」、円上にあるものが「Border」、円の外にあるものが「Noise」となります。これを周囲に拡張していきます。
p.2 水色の部分が拡がっていき、周囲にないとそこで1つのクラスタとします。次は、左下の緑のところでクラスタが形成されます。
p.3 昨日のKMeans法では、月形状のデータをの一部が他のクラスタのもの(ピンク色の部分)とみなしてしまいました。重心法なので、近い部分を仲間としてしまいました。今回のDBSCAN法は、月形状に沿って、仲間を増やしていきますので、クラスタ分類可能になります。まるでアメーバーのようです。 「手つなぎ鬼」という鬼ごっこしたことありますか? 最近のお子さんは、こんな遊びしないのかな? コミュニケーション取るのによい遊びなんだけれども。
以上、教師なしでクラスタ分類する代表的なアルゴリズムを2種類説明しました。 DBSCAN法が万能という訳ではありませんが、KMeans法よりは精度が高いようです。明日は、他のアルゴリズムでの分類結果を示します。