非階層クラスター分析に用いるK-means法については、「クラスタ分けを体験」で取り上げました。今回、統計ソフトRで分類して図に描いてみました。
資料をご覧ください → クラスター分析その5
100個のxとYのデータがあり、散布図で描くと右上の図のようになります。これをクラスターに分けて描きます。先ず、データをCSVファイルで保存します。統計ソフトRを立ち上げて、左下のコードを入力して実行すると右下の図があっという間に得られます。
①Data <- read.csv("パス名\\K-means(R).csv")で保存しておいたcsvファイルを読み込み、Dataという変数に代入します。「<-」は矢印を表していて、代入する記号です。パス名において「\」では読み込みエラーが出る場合「¥¥」や「/」を試してみてください。
②km <-kmeans(Data,4)は、読み込んだDataをK-meansを用いて4つのクラスターに分類します。他の数字を入れると異なった図が得られます。
③result <- km$clusterは、クラスターの分類結果が記録されます。resultで結果が表示されます。
④library(cluster)でclusterパッケージを読み込み、 clusplotでクラスタリング結果をプロットします。