聖マリアンナ医科大学腎臓・高血圧内科の野田竜之介氏らは、微小変化型ネフローゼ症候群とも呼ばれる微小変化群(minimal change disease;MCD)の非侵襲的な診断に役立つ予測モデルの開発を試み、その結果をSci Rep(2024; 14: 23460)に発表。「機械学習に基づく予測モデルによりMCDの非侵襲的診断の可能性が期待できる」と述べている。
ネフローゼ症候群のデータを機械学習アルゴリズムに適用
MCDは、成人におけるネフローゼ症候群の原因疾患の1つだが、他の原因疾患と異なり、数日から1~2週間という短期間での急激な増悪を特徴とする。MCD患者の25~35%は急性腎障害を発症し、重症例では緊急血液透析が必要となる場合もある。
成人のネフローゼ症候群の原因は多様であるため、一般的な臨床検査によるMCD診断は難しく、腎生検による確定診断が必要となる。しかし、腎生検は出血や動静脈瘻、感染などのリスクを伴い、何よりも結果を得るまでに時間がかかる。腎生検を施行せず、血液や尿のバイオマーカー(IL-12p40、CD80、脂肪酸結合蛋白4、EGFなど)を使ったMCD診断の可能性が検討されているが、こういったマーカーの測定は普通の医療施設では不可能だ。
そこで野田氏らは、聖マリアンナ医科大学病院の電子記録データからネフローゼ症候群患者のデータを抽出し、4種類の機械学習アルゴリズム(TabPFN、LightGBM、Random Forest、Artificial Neural Network)およびロジスティック回帰を用いた予測モデルを開発。各モデルによるMCD診断のROC曲線下面積(AUROC)および精密-リコール曲線下面積(area under the precision-recall curve;AUPRC)を求めた。
TabPFNによる予測パフォーマンスが最善
2006年1月~24年3月に同院で腎生検を受けた18歳以上の患者のうちネフローゼ症候群と確定診断された248例を抽出した。そのうちMCD群は82例(33%)で、非MCD群には、膜性腎症(51例、21%)、ループス腎炎(33例、13%)、糖尿病腎症(23例、9%)、巣状分節性糸球体硬化症(22例、9%)などが含まれていた。年齢中央値はMCD群が51.5歳、非MCD群が61.5歳だった。
身体計測、血液、脂質、尿蛋白などに関するさまざまな所見を変数として4種類の機械学習アルゴリズムとロジスティック回帰に適用したところ、AUROC(0.915、95%CI 0.896~0.932)、AUPRC(0.840、0.807~0.872)のいずれについてもTabPFNで最も優れた値が得られた。ただし、他の3つのアルゴリズムおよびロジスティック回帰のパフォーマンスも悪いものではなく、アルゴリズム間に有意な差はなかった。
各変数の予測結果に与える影響をSHapley Additive exPlanations(SHAP)を用いて算出し、ビースウォーム・プロットで表したところ、TabPFNではC3、総コレステロール、尿中赤血球が重要な予測因子として同定された。
多施設での妥当性検証が必要
以上の結果について野田氏らは「今回開発した4つの機械学習アルゴリズムおよびロジスティック回帰モデルは、いずれも内的妥当性を確認できた。中でもTabPFNのパフォーマンスがAUROC、AUPRCの両方で最も高く、MCDの診断予測モデルとしての有用性が示唆された」と考察。「ただし、今回のモデルは単施設のデータのみに基づくものであり、多施設での信頼性や頑健さを保証できるものではない。実臨床で応用するには、複数施設にまたがる外的妥当性の検証が必要だ」と付言している。
(医学ライター・木本 治)