医療分野における深層学習についてまとめました。
資料はこちら → 医療分野深層学習
p.1 医療分野におけるタスク、深層学習のモデル及び用途について表にまとめています。ResNetやDenseNetは画像分類の基本的な深層学習モデルです。ResNetは残差を元の情報に加えて予測値を出力するものです。DenseNetは、ResNetが複数繋がり、残差をスキップさせて加えていくモデルです。馬の画像データを入力して、「horse」と出力します。ChexNetは、胸部X線写真から14種類の肺疾患を検出するモデルです。Vision Transformerは、背景のある猫や飛行機の画像から、猫や飛行機だけを抽出することができます。「セグメンテーション」は、画像内の複数の物体を認識して区別する機能です。物体検出は、認識後に物体名を表示します。「自然言語処理」については、次ページで説明します。異常検知については、p.3で説明します。この表内の全てについて説明できませんので、興味のある方はネットなどで調べてください。
p.2 BERT(Bidirectional Encoder Representations from Transformers)は、Googleの自然言語処理モデルで、種々の場面で利用されており、特に医療分野では「ClinicalBERT」として、例えば、臨床記録に含まれる情報に基づいて、30日以内の再入院予測精度を向上させる事例などで利用されています。一番上に、再入院の確率が示されています。学習することにより、日毎に確率が減少していきます。医療文書を事前に学習して、一番確率の高い適用事例を示すこともあります。患者の症状について、医学論文や過去の臨床データを学習して病名を診断します。
p.3 AnoGANによる異常検出の事例です。画像の一行目は入力画像、二行目は対応ベクトルによる生成画像、三行目は残差を重ねたもの、四行目が病変箇所です。左の3列は事前のトレーニングセット、右隣の3列はテストセットの正常画像、右の5列はテストセットの病変画像です。