医学部・学会情報

中内耳C T(コンピューター断面撮影)を用いた中耳真珠腫進展範囲に関する人工知能診断システムの作成に世界で初めて成功 ―希少疾患に対する人工知能研究の発展に期待―
東京慈恵会医科大学、サイオステクノロジー

 東京慈恵会医科大学耳鼻咽喉科学講座 高橋昌寛助教、山本裕教授、小島博己講座担当教授、東京慈恵会医科大学放射線医学講座 馬場亮助教、尾尻博也講座担当教授らとサイオステクノロジー株式会社 野田勝彦、吉田要らの研究グループは、中内耳C T水平断のみを用いて有病率の低い中耳真珠腫乳突腔進展に関する高い精度の人工知能診断システムの作成に世界で初めて成功しました。本研究の応用により他の希少疾患に対する人工知能研究につながっていくことが期待されます。

 中耳真珠腫は骨破壊・脳膿瘍(のうよう)などの致命的な合併症を起こしうる難治性の慢性増殖性疾患です。CT(コンピューター断面撮影)で中耳真珠腫の進展範囲を決定することは困難ですが、微細な特徴を人工知能が捉えC Tのみで診断することが世界で初めて可能となりました。中耳真珠腫の有病率は低いが学習方法の工夫により高い精度の診断システムを作成できました。これにより適切な治療選択が可能となります。また他の希少疾患に対する人工知能研究への発展が期待できます。

 ・有病率の低い中耳真珠腫に対する人工知能によるCTを用いた画像診断法を検討しました。
 ・術式選択に関わる乳突腔進展有無について、水平断CTのみの情報から人工知能の評価と耳鼻科医による評価を行ったところ、最良のAI診断モデルでの平均予測精度は 81.14% (感度 = 84.95%,特異度 = 77.33% )であり、耳鼻科医の平均精度は73.41%(感度83.17%、特異度64.13%)でした。
 ・今後さらなる詳細な評価を行い、今回の研究成果をもとに他施設共同研究を行う予定です。

 本研究の成果は10月3日(月)14時00分(アメリカ東部時間)にPLOS ONE誌に掲載されました。

 〔研究の詳細〕

 1.背景

 中耳真珠腫は骨破壊・脳膿瘍などの致命的な合併症を起こしうる難治性の慢性増殖性疾患で高い再発率が問題となっています。中耳真珠腫中耳真珠腫の病変の範囲により、耳後部切開の必要性などさまざまな手術方法の選択を検討します。なかでも乳突腔への進展は、経外耳道的内視鏡下耳科手術の適用などさまざまな判断に影響を与えます。しかし、現在の画像検査では病変の範囲を十分に確認できず、術中にアプローチの変更を余儀なくされることがあります。画像検査としてはまず高解像度CTを用いて、真珠腫の範囲やその合併症の術前評価が行われます。しかしCT上では、真珠腫と炎症性変化の部分は類似した陰影を示すため、区別することは難しいのが現状です(図1a)。MRI(特にnonEP DWI)を用いることで診断可能な症例もありますが、MRI検査を実施できる施設の地域差が大きく、費用や時間がかかるという点、金属や閉所恐怖症などの制約があります。さらに、MRIを実施しても解像度に限界があるため、診断することができても病変の範囲を正確に把握することは困難です(図1b)。そのため、CTの診断精度を向上させることが重要と考えています。

 近年の人工知能(AI)や機械学習技術の革新は医療分野の大きな進歩をもたらしています。機械学習による予測の実用化は2000年に始まり、その後、コンピューターのハードウエア性能の劇的な向上により、2010年に深層学習:Deep Neural Network(DNN)が導入されました。2012年には、ImageNet Large Scale Visual Recognition Challengeにおいて、DNNの精度が従来の画像処理手法を上回り、最終的には2015年に人間の画像認識精度を上回りました。しかし、DNNモデルの学習には一般的に大量のデータが必要であり、希少疾患の診断への応用は依然として困難な状況です。少ないサンプル数で精度を向上させるシステム解析手法の開発は、医療AI研究の重要な課題です。

 中耳真珠腫の有病率は1/25,000人と低いため、DNN学習データの利用はさらに制限されます。本研究では、限られた症例数でも真珠腫の進展度を診断可能な手法を開発することを目的としました。また、実用性を判断するために、作成したDNNモデルと耳鼻咽喉科医が行う評価を比較しました。

 2.手法

 2011年から2020年に東京慈恵会医科大学付属病院耳鼻咽喉科において、弛緩(しかん)部型真珠腫に対して初回手術と治療前評価のための側頭骨CTを受けた164例(男性104例,女性60例,年齢層13~82歳,平均年齢[±SD]42.0±15.3歳)(右83例,左81例)を対象としました。弛緩部型真珠腫の診断は術中所見および摘出組織の病理組織学的検査に基づいて行いました。乳突腔進展を示す症例(M+)と進展を示さない症例(M-)の2群に分類したところ、80例と84例がそれぞれM+とM-に分類されました。CTの閾値は骨条件で行い(window center: 700, window width: 4000)、患者情報は削除し、水平断画像のみを用いて、上半規管の頭側から尾側方向に30スライスを抽出しました。そのうちDNNモデルの学習と評価のために病変部が含まれるスライスを抽出しました。患者を無作為に8グループに分け、学習用と評価用を分けて交差検証を行いました。

 ニューラルネットワークと学習

 学習時には、224×224ピクセルのサイズに切り出した画像を用いて、画像の病変部を範囲内に収めながらDNNモデルを学習させました。一つのDNNモデルの1回の学習サイクルでは、50回の反復学習を繰り返し実行しました。この学習サイクル を 8 つのデータセットで行い、1 つの学習セットで 8 つのモデルを生成しました(学習セット:評価セット=7:1)。各DNNモデルの学習は少数の患者からオーグメントで生成した大量のデータを用いるため、学習するたびに能力・精度に差が出でます。その能力・精度の変動を検証するために、24の学習セットを作成しました。その結果、8 データセット×24=192 個のモデルが生成されました。

 耳鼻咽喉科医による読影

 経験年数3年から33年の耳鼻咽喉科医15人が、AIが評価した画像と同じ水平断CT画像を読影して、乳突腔進展の有無についてそれぞれ診断しました。

 3.成果

 単一画像単位予測(Single-Image Unit-Based Prediction)/患者単位予測(Patient Unit-Based Prediction)

 単一画像単位予測における最高の精度は25%画像に対するアンサンブル予測によって実行された際の75.43%(感度=77.12%、特異度=73.75%)でした。患者単位予測における最高の精度は、25%画像に対するアンサンブル予測によって実行された81.14%(感度= 84.95%、特異度= 77.33%)でした。この結果から、アンサンブル予測は単一モデルの予測よりも精度が良く、25%画像に対する予測は、元画像(100%画像)の予測よりも良い性能をもたらすことが明らかになりました。

 耳鼻咽喉科医の診断精度・AIとの比較

 耳鼻科医の診断精度は平均73.41%(感度83.17%,特異度64.13%)でした。診断医が少ないため断定はできませんが、臨床経験による明らかな影響はありませんでした。

 また術中所見における乳突腔進展有無による違いとCTにおける軟部陰影有無のよる違いをそれぞれ検討したところ、耳鼻科医では術中の実際の乳突腔進展の有無についてもCT陰影の有無についても正答率に15~20%の差があったのに対し、AIでは10%以下の差にとどまりました。さらに、術中所見とCTの陰影が一致しているか否かによる違いは、耳鼻科医が65.1%(87.7-22.6%)、AIが33.2%(84.0-50.8%)でした。これらのことから、耳鼻科医は主に陰影の有無で判断しているがAIはそうではないこと、人間が判断しにくい症例でAIの方が正答率の高い症例があることが示唆されます。一方で耳鼻科医が容易に診断できるがAIの精度が低い症例もありました。これは、耳鼻科医は乳突腔を明確に定義できることと、耳鼻科医にとって一般的な所見であってもあまりにも著しい進展例でAIが初めて見る画像ではAIの十分な性能を発揮できないためと考えています。この点については症例数を増やすことで解決されると思っています。少ない症例数で高い精度のAIを作成できましたが、今後はより大規模な多施設共同研究の施行が望ましいです。

 4.今後の応用、展開

 真珠腫の乳突腔進展について水平断CTを用いたAI予測の精度を検討し、症例数が少ないにもかかわらず、精度の高いAIを作成できました。このことは真珠腫進展範囲の自動診断の重要な第一歩となると考えています。そして他の希少疾患に対するAI研究に光を与えるものであると考えています。今回の経験を生かし他の有病率の低い疾患に対する解析も行ってまいります。

 発表雑誌

 雑誌名:PLOS ONE
 論文タイトル:Preoperative prediction by artificial intelligence for mastoid extension in pars flaccida cholesteatoma using temporal bone high-resolution computed tomography: A retrospective study.
 著者:Masahiro Takahashi, Katsuhiko Noda, Kaname Yoshida, Keisuke Tsuchida, Ryosuke Yui, Takara Nakazawa, Sho Kurihara, Akira Baba, Masaomi Motegi, Kazuhisa Yamamoto, Yutaka Yamamoto, Hiroya Ojiri, Hiromi Kojima
 DOI番号:10.1371/journal.pone.0273915

 5.脚注、用語説明

 深層学習(ディープラーニング):
 深層学習とは、機械学習の手法の一つであり、多層のニューラルネットワークまたは複数の機械学習アルゴリズムを組み合わせた手法のことを指します。

 ネットワークモデル:
 深層ニューラルネットワークの構造は、多数提案されており、代表的な構造には名称が付与され、総じてネットワークモデルと呼びます。

 オーグメント:
 オリジナル画像の明度やコントラストの変更、回転・反転、拡大・縮小などにより、擬似的に画像の枚数を増やす行為を指します。


以上


医学部・学会情報