統計ソフト「R」がExcelの分析ツールより優れているのが、多変量解析ではないかと思います。今日は、「主成分分析」と「対応分析」にるいて「R」を用いた実行例を説明します。
資料ご覧ください。 → 主成分分析
p.1 ①解析したいデータを「csv」形式で、作業するフォルダに保存してください。テキスト形式でもOKです。 Excelのファイル保存の際に、CSV形式を選択して保存です。 もし試してみたい方は、こちらのファイルです。→ sdata
②「R」を起動後、「ファイル」→「ディレクトリーの変更」→ 「データファイルのあるフォルダを選択」 ③「<」の後に、「pr<-read.csv("sdata.csv")」を入れてリターン ④次の「<」の後に、「biplot(princomp(pr,cor=TRUE))」を入力してリターンで実行。
p.2 実行結果です。矢印の先に「taiiku」などの科目名が書いてあります。その矢印の方向に行くにつれて効果が大きいこと、この場合は得意であることを意味しています。青○内の80番の人は、他の科目は真中レベルで、体育が得意です。60番の人は数学や理科が得意なので、理系指向ですね。
p.3 「R」を起動後、上記②を実施後、①~④の手順で入力して実行してください。目と髪の色の人数が左下のデータです。今回は「対応分析」という手法です。目と髪の色に対応関係があるかを解析します。 実行結果が右図です。黒字が目に色、赤字が髪の色に対応しています。 ピンクの四角内を表とグラフで見比べてください。「blueとlight」の目の方の髪は「fair」に対応していることがグラフで近くに位置していることからわかります。緑についても表とグラフが対応しています。
いかがでしたか? Excelではこのような解析はできません。 minitabのような統計ソフトは可能ですが、「R」はコマンドを覚えれば、1行で指示して実行可能です。また、1行ずつ小分けで実行も可能ですので、統計を勉強する上で有効なツールです。
主成分分析がどのような意味があるのかは、こちらのサイトが有用です。 全部見たわけではありませんが、「R」についての説明やサンプルデータ、その他の統計に関する情報が盛りだくさんあります。 → https://statistics.co.jp/ この「R」をインストールした際に「Mirror」でjapanのサイトを選択したと思いますが、ここでした。