「医」の最前線 AIと医療が出合うとき

新型コロナ後遺症の解明に向けて
~Long COVIDへのAI活用~ (岡本将輝・ハーバード大学医学部講師)【第10回】

 新型コロナウイルス(SARS-CoV-2)感染症の拡大は人々に深刻な影響を与えたが、特に、「急性期の症状が軽快した後」にも中長期に渡って何らかの症状を残す、いわゆるLong COVID(COVID-19罹患後症状)の存在が顕在化している。罹患(りかん)後症状については国内外で大規模な疫学調査結果が報告されており、代表的な症状として、倦怠(けんたい)感や筋肉痛などの全身症状、せき息切れ胸痛などの呼吸器症状、記憶障害や抑うつ、不眠、集中力の低下といった精神神経症状、また、その他にも嗅覚障害や味覚障害、動悸(どうき)、腹痛などが確認されている。

 実に多様な症状を呈する一方、現時点で、この後遺症について明らかな病態の解明には至っておらず、その発症リスク予測や特異的な治療方法の確立を含めた新たな課題が浮き彫りとなっている。今回はこのLong COVIDについて、AIを活用した疾患理解への取り組みを紹介したい。

オミクロン株BA.5対応のワクチン=AFP時事

オミクロン株BA.5対応のワクチン=AFP時事

 ◇誰が「潜在的なLong COVID患者」なのか?

 米ノースカロライナ大学などの研究チームはNational COVID Cohort Collaborative(N3C)の電子カルテリポジトリを用い、「罹患後症状を持つ可能性のある患者」を特定するための機械学習モデルを構築している。N3CはCOVID-19研究推進のために構築された米国の大規模匿名化データセットで、800万症例に及ぶ臨床データを多施設から集積している。本研究でもN3Cに含まれる約10万症例を抽出し、モデル構築と検証に活用した。

 2022年7月にThe Lancet Digital Healthに公開されたチームの研究論文(※1)によると、この機械学習モデルが潜在的なLong COVID患者を高精度に識別できることを明らかにしており、これはモデルによってフラグを立てられた患者を専門クリニックに誘導することで、早期からの有効なモニタリングと治療介入を実現できる可能性を意味する。さらに、本ツールの活用は臨床試験の効果的実施に資する可能性も研究者らは指摘している。つまり、Long COVIDの病態解明や治療法開発を見据えた臨床試験を設定する際、診療記録から自動識別することで、研究対象となる候補者を抽出することができる。未診断で治療介入の無い潜在患者も含めた「患者コホートの正確な特定」は有効な検証に欠かせず、大規模な臨床評価が急務となっている現状では、今後の研究発展を支援する基礎技術として一定の価値を示している。

 一方、研究者らは、このような診療記録ベースのツールが「医療機関を受診した人々のデータのみ」から構築されており、実際に受診した患者集団にしか適用できないことを限界として認識している。つまり、ケアアクセスの限定される集団など、そもそも病院未受診である人々はこのような知見の恩恵から漏れることになる。さらに、多様なリアルワールドデータを活用することで適用範囲の拡大を狙うなど、研究者らはモデルの改良を続けている。また同時に、モデル構築の透明性を担保し、新たなデータソースに基づく再トレーニングやチューニングを容易にすることで、医療機関の垣根を越えた検証と活用の機会も広く提供している。

イメージ写真=AFP時事

イメージ写真=AFP時事

 ◇Long COVIDの発症を予測

 将来的な発症のリスクを推定することも、疾患の予防・介入・管理にとって重要な要素となる。英University College Londonの研究者らは、血液検査からLong COVID発症リスクの高い個人を特定できる可能性を明らかにしている。eBioMedicineに22年9月に公開された論文(※2)では、チームは医療従事者156人を対象とした研究において、新型コロナに感染した者の血中タンパク質91種を分析し、感染していない者のサンプルと比較することによって新たな成果を導いた。

 研究者らは、感染後6週間までに一部のタンパク質レベルに大きな差があることを明らかにしたが、確認されたこのプロテオームの乱れは、症状の程度および症状の持続と強く関連していた。さらに、この事実に基づき、感染1年後に症状が持続しているかを予測する機械学習モデルの構築にも成功している。サンプル数が少ないこと、症状の自己申告バイアスを排しきれないこと、予測モデルの外部検証が行われていないことなど研究デザインの制約に伴ういくつかの限界はある一方、非重症の新型コロナ感染が最初のPCR陽性反応から少なくとも6週間までにプロテオームを変化させること、タンパク質情報から長期的な症状持続を予測し得ることは興味深い成果で、今後、他集団における検証が進むことも期待される。

 今回は、Long COVIDについてAIを活用した研究事例を紹介した。21年、22年と罹患後症状に関する新規論文数は急激に増えており、研究コミュニティーの関心の高さとともに、社会に対する疾患負荷の大きさを物語っている。ここでもAIアプローチが多面的に利用され、科学的エビデンスの蓄積を助ける一つの手段として現在有効に機能している。(了)

【引用】
(※1)Pfaff ER, Girvin AT, Bennett TD, et al. Identifying who has long COVID in the USA: a machine learning approach using N3C data. Lancet Digit Health. 2022; 4:e532-e541. doi: 10.1016/S2589-7500(22)00048-6.
(※2)Captur G, Moon JC, Topriceanu CC, et al. Plasma proteomic signature predicts who will get persistent symptoms following SARS-CoV-2 infection. EBioMedicine. 2022: 104293. doi: 10.1016/j.ebiom.2022.104293.

岡本将輝氏

岡本将輝氏

【岡本 将輝(おかもと まさき)】

 米ハーバード大学医学部放射線医学専任講師、マサチューセッツ総合病院3D Imaging Research研究員、The Medical AI Times編集長など。2011年信州大学医学部卒、東京大学大学院医学系研究科専門職学位課程および博士課程修了、英University College London(UCL)科学修士課程修了。UCL visiting researcher、日本学術振興会特別研究員(DC2・PD)、東京大学特任研究員を経て現職。他にTOKYO analytica CEO、SBI大学院大学客員教授(データサイエンス・統計学)など。メディカルデータサイエンスに基づく先端医科学技術の研究開発、社会実装に取り組む。

【関連記事】


「医」の最前線 AIと医療が出合うとき