「ROC曲線」を実際に作成してみましょう。では早速資料をご覧ください。
資料 → ROC曲線その2
p.1 昨日の再掲です。このグラフを描きます。
p.2 10人の対象者に問診した得点の合計と実際の「うつ病患者」と「健常者」の診断結果を用いて、診断の確からしさをROC曲線に描いてみます。①問診結果です。②問診結果の得点が高い順に並べ替えます。③カットオフポイントを最小得点~最高得点+1の範囲で設定できるようにします。得点が、設定したカットオフポイント以上であれば「陽性」とします。右の上が「カットポイント18」、下が「カットポイント25」の場合です。④「うつ」「健康」「陽性」「陰性」のクロス集計表を作成して、⑤「感度」「偽陽性」を計算します(p.3の絵をみて計算してみてください)。「感度」の分母はうつ病者総数、「偽陽性」の分母は健常者総数になります。
p.4 カットオフポイント11~29各々について、p.2の③~⑤を繰り返し実行して「偽陽性率」と「感度」を計算した結果が左の図です。右の図は階段状ですがROC曲線です。理想からのズレを読み取ることができます。
実行したExcelファイルです → ROC曲線2
p.5 Excelでマクロを組めば、もっと簡単にできるとは思いますが、結構面倒です。 そこで以前紹介した無料で定評がある統計ソフト「R」を試してみます。インストールの方法は過去ブログ「思ったより操作簡単な統計ソフト「R」」をご覧ください。 インストールしましたら、次は「ROCR」というパッケージをインストールします。①「R」を起動後、②赤字の部分を入力してクリック(ROCRは大文字で入力すること)すると、右にミラーサイト一覧が表示されるので、③Jpnサイトを選択してクリック、④OKをクリックします。 ⑤しばらくインストール作業して完了となります。
p.6 ①「うつ」を「1」、「健康」を「0」に置き換えて、右の表をテキストファイル(ファイル名:roc_data2.txt)として予め保存しておきます。②「R」を起動後、左上のコマンドを入力します。 ③実行結果です。 右側にExcelで作成したROC曲線を再掲します。 いかがですか? データをテキストファイルにするだけで、自動で計算してグラフまで描いてくれます。便利ですね。
皆さんにお勧めするのは、面倒でもExcelで計算した方が仕組が理解できて勉強になります。統計ソフトでは直ぐに実行結果が得られますが、カットオフポイントの意味を理解することはできません。