トピックス 統計

理屈がわかったら即実行

投稿日:

ROC曲線」を実際に作成してみましょう。では早速資料をご覧ください。

資料 → ROC曲線その2

p.1 昨日の再掲です。このグラフを描きます。

p.2 10人の対象者に問診した得点の合計と実際の「うつ病患者」と「健常者」の診断結果を用いて、診断の確からしさROC曲線に描いてみます。①問診結果です。②問診結果の得点が高い順に並べ替えます。③カットオフポイント最小得点~最高得点+1の範囲で設定できるようにします。得点が、設定したカットオフポイント以上であれば「陽性」とします。右の上が「カットポイント18」、下が「カットポイント25」の場合です。④「うつ」「健康」「陽性」「陰性」クロス集計表を作成して、⑤「感度」「偽陽性」を計算します(p.3の絵をみて計算してみてください)。「感度」の分母はうつ病者総数、「偽陽性」の分母は健常者総数になります。

p.4 カットオフポイント11~29各々について、p.2の③~⑤を繰り返し実行して「偽陽性率」と「感度」を計算した結果が左の図です。右の図は階段状ですがROC曲線です。理想からのズレを読み取ることができます。

実行したExcelファイルです → ROC曲線2

p.5 Excelマクロを組めば、もっと簡単にできるとは思いますが、結構面倒です。 そこで以前紹介した無料で定評がある統計ソフト「R」を試してみます。インストールの方法は過去ブログ「思ったより操作簡単な統計ソフト「R」」をご覧ください。 インストールしましたら、次は「ROCR」というパッケージをインストールします。①「R」を起動後、②赤字の部分を入力してクリック(ROCRは大文字で入力すること)すると、右にミラーサイト一覧が表示されるので、③Jpnサイトを選択してクリック、④OKをクリックします。 ⑤しばらくインストール作業して完了となります。

p.6 ①「うつ」を「」、「健康」を「」に置き換えて、右の表をテキストファイル(ファイル名:roc_data2.txt)として予め保存しておきます。②「R」を起動後左上のコマンドを入力します。 ③実行結果です。 右側にExcelで作成したROC曲線を再掲します。 いかがですか? データをテキストファイルにするだけで、自動で計算してグラフまで描いてくれます。便利ですね。

皆さんにお勧めするのは、面倒でもExcelで計算した方が仕組が理解できて勉強になります。統計ソフトでは直ぐに実行結果が得られますが、カットオフポイントの意味を理解することはできません

-トピックス, 統計

Copyright© 進化するガラクタ , 2020 All Rights Reserved Powered by STINGER.