中国・Chinese University of Hong KongのCarol Y. Cheung氏らは、4カ国の8施設で行われた臨床試験11件の対象となったアルツハイマー病(AD)患者648例と非AD3,240例の網膜画像データを用い、ADを検出するディープラーニング(深層学習)モデルを開発。検証の結果、83%超の高精度でADが検出され、アミロイドPETにおける陽性例と陰性例も80%超の高精度に識別できたとLancet Digit Health2022; 4: e806-e815)に発表した。網膜画像のみでADを検出する深層学習モデルは、今回が初めてであるという。

教師あり学習、教師なしドメイン適応を実施

 ADは診断が複雑であり、専門施設以外では難しいアミロイドPETなどの高度な検査が必要な場合もあり、プライマリケアでの実施に適した簡便なスクリーニングモデルが求められている。一方、AD患者の剖検結果では網膜の変化が指摘されており、網膜の画像はプライマリケアにおいて低費用かつ非侵襲性で広く利用可能な眼底カメラで撮影することができる。

 そこでCheung氏らは、4カ国(中国、シンガポール、英国、米国)の8施設で行われた臨床試験11件に参加したAD患者648例(5,598画像)と非ADの対照3,240例(7,351画像)の網膜画像データ計1万2,949件を後ろ向きに収集し、網膜画像のみでADを検出する深層学習モデルを開発した。教師なしドメイン適応を用いて試験間のデータセットの偏りを軽減し、4種類の画像(左右眼の視神経乳頭と黄斑を中心とする網膜画像)に見られるAD患者の網膜の特徴を統合したデータについて教師あり学習を行ったモデルを検した。

AD検出の感度93.2%、特異度82.0%

 まず、6件の試験のデータセットを用いて内部検証を行った結果、深層学習モデルによるAD検出の正診率は83.6%〔標準偏差(SD)2.5〕、感度は93.2%(同2.2)、特異度は82.0%(同3.1)、受信者動作特性(ROC)曲線下面積(AUC)は0.93(同0.01)と高精度だった。

 次に、5件の試験のデータセットを用いて学習済みモデルをテストした結果、正診率は79.6%(SD 15.5)~92.1%(同11.4)、AUCは0.73(同0.24)~0.91(同0.10)だった。

 さらに、アミロイドPETを施行していた5件中3件の試験のデータセットを用い、アミロイドβ陽性と陰性の識別能を評価した。その結果、AD検出と同様に正診率は80.6%(SD 13.4%)~89.3(同13.7%)、AUCは0.68(同0.24)~0.86(同0.16)と高精度だった。

 サブグループ解析では、ADの有無およびアミロイドβ陽性/陰性の識別能は、眼疾患の非併発例(正診率71.7%、SD 11.6%)と比べて併発例(同89.6%、12.5%)で、非糖尿病患者(同72.4%、11.7%)と比べて糖尿病患者(同81.9%、20.3%)で、それぞれ向上することが示された。

高度な画像検査は不要で費用効果が高い

 これまで、網膜画像を用いて糖尿病網膜症などの眼疾患や心血管疾患、糖尿病などの全身性疾患を検出する深層学習の応用例はあったが、網膜画像からのAD検出における深層学習の役割は明らかでなかった。Cheung氏らは「網膜画像のみでADを検出する深層学習モデルは、今回が初めて」としている。

 ADの深層学習モデルとしては、これまでに複数の眼科画像診断法〔光干渉断層撮影(OCT)、OCT血管造影、超広視野網膜イメージング、網膜自家蛍光画像〕と患者データを併用してADを予測する深層学習システムが提案されていた。しかし、サンプルサイズが159例〔うちAD患者36例(23%〕と小さく、プライマリケアでは利用できないこともある専門的な画像診断法が必要とされていた。

 同氏らは「われわれのアルゴリズムは網膜画像のみでのAD予測が可能なため、より効率的であり、費用効果が高まる可能性もある」と述べ、「多人種、多国籍の臨床例から成るデータセットを用いているという強みがある」と指摘。その上で、「今後、さらに多様な集団・環境への一般化の検討、各種の眼底カメラで撮影した網膜画像による評価、深層学習アルゴリズムの解釈可能性(深層学習によるプロセスを人間が解釈可能かどうか)および臨床実装に関する研究が必要になるだろう」と展望している。

(太田敦子)