トピックス 統計

思ったより操作簡単な統計ソフト「R」

投稿日:

知り合いの還暦祝いの会に出席していたので、投稿遅くなりました。 Excelの分析ツールが統計を勉強するにはいいよとかFDA対応ならMinitabが通りがいいよという話を以前してきました。 今回は、無料の統計ソフト「R」について説明します。「R」は、コマンドプロンプト「>」のある画面でコマンドを覚えないと使えないのではという先入観があったので、専らExcelの分析ツールを使用していました。 今回「R」を使ってみて、マトリックスの計算や多変量解析は、こちらの方が使い易いのではないかと思いました。会社内なら、Minitabの方が楽かもしれませんが、自由度がある点では、こちらかなとも思います。 先日紹介した「python」にも「pandas」という統計ライブラリーがあります。「pandas」はまだ未使用なので、分かり次第、比較してみたいと思います。

資料ごらんください。 → 統計ソフトR

p.1~3 先ずは、インストールをします。①、②「CRAN」で検索して「The Comprehenshive R Archive Network」をクリックします。③左端上の「Mirror」をクリックすると各国の機関名とアドレスがありますので、④「japan」の中の「The institute of Statistical Mathematics, Tokyo 」のアドレスをクリックします。サーバー等の負荷を減らすため、使用者の近くに分配するための処置だそうです。 ⑤「Download R for windows」をクリックしてください。Macの場合は、一つ上のアンダーライン部をクリックします。⑥左上の「base」をクリック ⑦「Download R 3.5.2 for Windows」をクリック ⑧「実行」をクリック ⑨~⑪ 次に進んでいってください。⑫□内にレ点を入れて次へ ⑬、⑭次へ ⑮□にレ点入れて次へをクリックするとインストール開始します。 ⑯完了をクリックすると ⑰デスクトップにアイコンが現れます。⑫で32bitと64bitにチェックを入れると、2つのアイコンが現れます。通常は32bitでも十分です。

p.4 ⑱アイコンをクリックすると、真中上の画面が現れます。 ⑲以降は資料をご覧ください。 「」の後に、コマンド(命令)を書き入れてリターンを押せば、1行ずつ実行していきます。四則演算は、Excelの「=」がないものとにています。変数に数値を代入するときは「<-」を用います。この右の数値を左の変数に入れる(代入)することを意味します。矢印と似ていますね。 「(数値、数値、数値)」の「はcombineの頭文字で、まとめるという意味です。この場合は、変数にまとめて3つの数値を代入するという意味です。「(110)」と書いた場合は、変数に110の数値を代入するということになります。変数には、複数の数値を代入できます。 通常のプログラムの場合は、変数に幾つ数値をいれるかを予め宣言することが多いですが、このソフトはないので、楽です。 単価と個数が複数ある場合の、単価×個数は、場合分けして個々に計算した結果を表示してくれます。 行と列の数が同一でない場合、Excelでは複雑な演算処理ですが、この「R」はマトリックス同士の計算も楽に実行します。

p.5 合計、平均、Max、Minなどの計算式はExcelとほぼ同じです。「R」にはサンプルデータがあります。その一覧は「data()」で表示されます。「data(anscombe)」をインプットし「anscombe」を実行すると、データが表示されます。このデータの1列目と5列目を指示して「散布図」を描いたものが右下のグラフです。変数xに1列目のデータを、yに5列目のデータを入力して「cor(x,y)」を実行すると「相関係数」を計算して表示します。

p.6 正規分布の乱数の発生頻度ヒストグラムで描くコマンドです。 ヒストグラムの幅を予め設定して、描きます。 描いたヒストグラムの上にカーソルを置いて右クリックして「メタファイルに保存」すると、ワード等にペースト可能になります。

今日は、ここまで。明日は、簡単にできる多変量解析の話をします。「R」は、簡単なコマンドを用いて、「多変量解析」において、Excelより威力のあるツールであると思います。

-トピックス, 統計

Copyright© 進化するガラクタ , 2019 All Rights Reserved Powered by STINGER.