胸部X線は幅広く用いられている最も基本的な検査の1つだが、肺機能が評価できるかは明らかでない。大阪公立大学大学院人工知能学准教授の植田大樹氏らは、国内5施設・8万例超のデータを用いたディープラーニングにより、X線画像から肺機能を高精度に推定する人工知能(AI)モデルを開発。肺機能検査が困難な場合や、感染症の流行などにより同検査が実施できない場合の代替検査法として活用しうると、Lancet Digit Health2024年7月8日オンライン版)に発表した。(関連記事「X線1枚で年齢を推定するAIを開発」)

X線+スパイロメトリー値14万組超が対象

 肺機能検査(スパイロメトリー)は、特に慢性閉塞性肺疾患(COPD)と喘息の評価に有用である。だが、認知症患者や小児など、指示の理解が難しく検査への協力が得られにくい症例では正確な評価が困難だ。また、新型コロナウイルス感染症の流行下のように、感染リスクを避けるために検査自体が制限されるケースもある。

 これに対し、胸部X線検査には時間がかからず再現性が高いという利点がある。そこで植田氏らは、AIを活用してX線画像から肺機能を推定するモデルの開発に着手した。

 対象は、2003年7月1日~21年12月31日に大阪府の5施設〔A:大阪公立大学病院(旧大阪市立大学病院)、B:大阪府立病院機構大阪はびきの医療センター、C:大阪公立大学病院先端予防医療部附属クリニックMedCity21(同)、D:東住吉森本病院、E:市立柏原病院〕で収集した患者8万1,902例のX線画像およびスパイロメトリー値〔努力肺活量(FVC)、1秒量(FEV1.0)〕14万1,734組のデータ。

 まずA~Cの3施設のデータ(7万5,768例・13万4,307組、平均年齢56歳、女性50%)でAIの訓練・検証を行い、その後D(1,861例・2,137組、同65歳、40%)、E(4,273例・5,290組、同63歳、46%)のデータで外部テストを実施。AIの精度は、FVCおよびFEV1.0における推定値と実測値のピアソン相関係数(R)、級内相関係数(ICC)、二乗平均平方根誤差(RMSE)、平均二乗誤差(MSE)、平均絶対誤差(MAE)で評価した。

FVC、FEV1.0ともに高い一致率

 検討の結果FVCに関しては、施設DとEのR値はそれぞれ0.91(99%CI 0.90〜0.92)と0.90(同0.89〜0.91)、ICC値は0.91(同0.90~0.92)と0.89(同0.88~0.90)、MSE値は0.17L2(同0.15~0.19L2)と0.17L2(同0.16~0.19L2)、RMSE値は0.41L(同0.39~0.43L)と0.41L(同0.39~0.43L)、MAE値は0.31L(同0.29~0.32L)と0.31L(同0.30~0.32L)だった。

 FEV1.0については、施設DとEでそれぞれR値は0.91(99%CI 0.90〜0.92)と0.91(同0.90〜0.91)、ICC値は0.90(同0.89~0.91)と0.90(同0.90~0.91)、MSE値は0.13L2(同0.12~0.15L2)と0.11L2(同0.10~0.12L2)、RMSE値は0.37L(同0.35~0.38L)と0.33L(同0.32~0.35L)、MAE値は0.28L(同0.27~0.29L)と0.25L(同0.25~0.26L)だった。

 以上のように、AIの推定値はスパイロメトリーの実測値と極めて高い一致率を示した。植田氏らは「今回、X線画像から高精度に肺機能を推定できるAIモデルを世界で初めて開発することができた。患者負担の軽減はもちろん、スパイロメトリーの補完ツールとして使用でき、検査の効率化にもつながる」と結論。今後は、「一般化性能のさらなる検証や異なる集団・環境下での性能確認に加え、実際に使用した際の効果や影響を慎重に見極めつつ、臨床応用を目指したい」と付言している。

(小暮秀和)